智瞰AI|戴文渊:“百模大战”不是太多,而是远远不够-新华网
新华网 > > 正文
2025 02/13 09:26:27
来源:新华网

智瞰AI|戴文渊:“百模大战”不是太多,而是远远不够

字体:

新华网北京2月13日电 题:戴文渊:“百模大战”不是太多,而是远远不够

记者 陈听雨

每位即将分娩的孕产妇都可能面临一项重要抉择,顺产还是剖腹产?在医学高度发达的今天,这个决定往往会在孕期的最后才做出,且很大程度上依赖医生的丰富经验。

然而,在长春市妇产医院,带着对生命的敬畏,医生通过AI技术更精确地预测新生儿体重,为分娩方式提供更科学的决策支持。

医生将收过往集到的所有孕妇体检指标数据输入电脑中,最终构建出“新生儿体重预测模型”。这一模型能够提高胎儿体重估值的准确度,在这个过程中,一切由AI自动完成,这真的可靠吗?

结果出乎医生的意料。

原本依靠经验预估的新生儿体重误差,最高可达1斤左右(新生儿体重平均6-7斤);而应用“新生儿体重预测模型”后,所有案例的误差几乎被控制在了200克以内,比临床医学已经达到的精确度更高。

“新生儿体重预测模型”由长春市妇产医院的医生基于人工智能企业第四范式的AutoML技术及产品构建。在第四范式创始人、CEO戴文渊看来,人工智能时代,企业需要新技术的赋能,从而需要人工智能技术公司,这是时代赋予第四范式的机遇,“毫无疑问,我们抓住了这个机遇。”戴文渊说。

穿过第四范式颇具科幻感的环形展厅,仿佛穿越了人工智能发展的数次潮起与变革,AI大模型、生成式AI技术在2023年引爆全球,2024年国内市场迅速掀起“百模大战”,2025年“百模大战”开启下半场,对此,戴文渊在接受新华网科技频道独家专访时说,“AI大模型是需要数据灌溉的,是整个时代,是国家的广阔市场给我们创造了机遇。”

图为在第四范式创始人、CEO戴文渊接受新华网专访

从算力竞争到高质量数据竞争

除医学领域,AI技术还在更多其他领域有着广泛的落地应用。戴文渊举例说,比如利用AI帮助商业银行实现反欺诈。在引入AI之前,大部分银行由专家撰写反欺诈的业务规则,在过去几十年的时间内,这些业务规则大致累积了上千条,这意味着,当一笔交易发生时,银行会通过上千条规则来判断这笔交易是否存在欺诈。

“AI技术在赋能银行时,我们将过去十几年的数据全部交给AI去分析,AI在其中发现了大概20亿条规律,从1000到20亿,对于整个行业是一个巨大的进步。”戴文渊说,每一年,都有成百上千个不同但类似的案例在各行各业发生,把业务的规模做得越来越大,AI的参数量做得越来越大,模型做得越来越准,让业务效果变得越来越好。

在戴文渊看来,人工智能产业的主基调一直是快速向前发展,“对于中国AI行业来说,到了越来越好的阶段,进入越来越适合的发展节奏。”

对此他详细解释,前几年,因为有效数据量尚未被充分开发,所以只要把算力往上加,模型的效果就能继续提升。但近年来,很多AI大模型都遇到了瓶颈,加算力效果并不提升。这是因为,生成式AI非常需要纯净的数据,要让模型提升,就需要输入越来越多且越来越好的数据。如果新输入的一批数据比原先的数据质量差,很可能数据越多,模型的质量反而变差。

“中国AI的优势在哪?在产业,有AI真正可以落地的需求。虽然我们的算力资源可能不具有绝对优势,但现阶段,算力已不再是最核心的瓶颈,AI发展的瓶颈已从算力瓶颈转变为高质量数据的瓶颈,进入到高质量数据的竞争后,就会进入中国AI产业喜欢的节奏。”戴文渊说。

他认为,之所以中国AI产业能大有作为,是因为中国市场的行业门类齐全,各行业AI落地的需求巨大。“只要把我们的算力充分跑起来,在每个细分赛道,我们的目标都是提升有效参数量,有效参数越多,模型越准,业务就会越好,这样就形成了良性闭环,在每个赛道我们都要设计出这样的良性闭环。”

“100个大模型,远远不够”

截至2024年7月,我国已完成备案并上线的生成式AI大模型数量接近200个。2024年1至11月,大模型相关中标项目的盘点结果显示,国内大模型中标项目共728个,中标总金额为17.1亿元,分别是2023年全年数据的3.6倍、2.6倍。“百模大战”打响,大模型赛道的竞争进入卷生态、拼获客的阶段。

“我认为‘百模大战’不是坏事,是好事。在很多国家不会出现‘百模大战’,因为根本就不可能拉出100个AI团队。在中国能‘百模大战’甚至‘千模大战’,说明中国有人才,虽然现在中国的人口红利开始消退,但受过高等教育的人口红利正在崛起。”戴文渊说。

如今,千行百业都在基于自身核心业务对AI的需求向更具体的应用层转变,这些转变的背后,蕴藏着企业对有效的AI产品赋能自身核心价值的真实需求。

“我认为各行业的人士,首先应该思考的是行业需要什么,企业自身的核心竞争力是什么?而不是先问应该买多少块卡,模型参数量做到多少。”戴文渊以零售业举例称,比如零售企业的目标是提升供应链效率,那么确定目标定后,要看供应链效率提升需要什么样的AI模型,建立这样AI模型,需要什么样的数据,这些数据需要什么样的算法,算法需要跑在多大的算力上,这样逐层梳理清楚, AI也就在这个产业落地,并且创造价值了。”

从AI赋能千行百业智能化转型的角度来看,戴文渊信心十足,“我们的产业门类是齐全的,规模是巨大的,这两点分别对应着有需求和有数据,百模大‘战’根本就不成立,如果只有100个大模型,对中国来说其实是太少了,远远不够。”

“不期待超级英雄”

戴文渊曾打过比方说,“可以把当前的人工智能技术视为一名实习生,初期工作成果可能并不完美,但他们确实能够分担部分工作,AI的学习到达一定阶段后,或许就能胜任更加复杂和重要的工作任务。”

然而面对AI技术和工作模式的快速优化与迭代,戴文渊却并不期待现象级产品的诞生。

“我不否定现象级产品,如果能够出现现象级产品,那一定是好的,但是我并不去期待这件事情的发生。”他说,“有时候可能大家都希望横空出世一个超级英雄,超越了过去的所有榜样,但实际上,最终整个AI产业的蓬勃发展不可能靠一两个人、一两个产品,而是靠每一个人、在每一条细分赛道上辛勤耕耘。”

都说弱冠之年,尚不知虚名有何用。然而,戴文渊却在2004代表上海交大获得了ACM国际大学生程序设计竞赛总决赛冠军,21岁便开始在国际计算机领域崭露头角。

作为上海交大2002级ACM班上最耀眼的明星,戴文渊深知,在人工智能领域,注定不止一颗闪闪发光的星。如今四十出头的他,自认为在AI行业已经不算年轻人。

“每一代人都有自己的价值,现在的年轻人越来越厉害,环境越来越好,接受到的教育也是优质的,他们完全应该比我们做得更好。而我需要做的,是能够更好地支持更多优秀的年轻人,第四范式发展到今天,很多重要成果都是一些刚刚毕业一两年的员工做出的。在十几、二十几年前,这样的人才在中国非常稀缺,但今天,我们国家已经培养出了大量科班出身的AI人才,未来的高手就在他们中间。”戴文渊说。

【纠错】 【责任编辑:周靖杰】