来源:北京商报
作为开幕式最后一个环节的嘉宾、月之暗面CEO杨植麟刚走下台就被团团围住,杨植麟一边为难地重复着“以后还有机会”,一边在工作人员的帮助下匆忙离场。这是外行爱看的热闹。6月14日,北京智源大会开幕。我们在离杨植麟最近的地方,见证了一次大模型的“追星”现场。
当天,杨植麟和百川智能CEO王小川、智谱AI CEO张鹏、面壁智能CEO李大海进行了一场尖峰对话。这是内行爱听的门道。
两个场景,是中国AI市场由表及里、由外向内的写照。两者相连,既是现在,也是未来。
什么是AGI
大模型的突破,让人类通往AGI的终极幻想有了更大的可能。但对于AGI本身,业内似乎并没有统一定义。
杨植麟认为,当下AGI或许并不一定需要一个精确的、量化的定义,它也可能是一个定性且感性的存在,它的意义在于让社会或者人类对接下来要发生的事情有一个准备。不过杨植麟认为,在短期内,确实需要这样一种量化的定义,“因为如果完全没有量化,也自然无法衡量AGI开发的进度,从而影响整体发展”。
张鹏也更愿意相信,AGI是一种信念,一种符号,其内涵外延是在不断变化的。如果能把一件事情说得非常量化、非常清晰,那么天花板估计也就触手可及了。张鹏认为,对人工智能的发展而言,没人能够说清楚什么是AGI,反而可能是一件好事,这意味着还有更多未知空间等待探索。
王小川试图从“人”的角度理解AGI,即大模型能不能“造医生”。之所以选择这一指标,是因为AGI的第一个变化是大模型开始具有思考、学习、沟通、共情甚至多模态处理能力,就像是医生,既需要多模态,也需要减少幻觉,同时需要有强大的记忆能力、查文献能力、推理能力,如果把行业上能共识的能力都投射到做医生的标准中,那么这便可以成为一个指标——“人造医生”就是AGI。
李大海则尝试从经济学的角度定义AGI。在他看来,一个理想中的AGI,就是去执行任何任务的时候,边际成本都已经降为0。去年行业里大家推动大模型落地时,很多场景还需要做微调,这个过程的边际成本就很高。“我们相信,随着模型能力的提升,大模型门槛越来越低,成本也越来越接近于0的时候,AGI基本也就到来了。”
Scaling Law还是“信条”吗
大会上,一个词被反复提及——Scaling Law,这个类似于大模型版的“大力出奇迹”的法则,成功塑造出了OpenAI。但随着时间的推移以及AI的发展,这个参数越多模型越强的黄金法则,也逐渐陷入了摩尔定律一般是否接近失效的讨论。
杨植麟认为,Scaling Law本质上没有问题,只要有更多算力、更多参数,就会持续演进。但在这个过程中,如果一直沿用现在的方法,上限是很明显的,更关键的在于如何更高效地实现Scaling Law。
王小川也认为,在Scaling Law之外,一定要在数据、算法、算力等方面寻找范式上新的转化,“不论是战略上还是信仰上,我认为Scaling Law之外都还有范式变化的可能,不只是去简单地变成压缩模式,而是会走出一个体系,这样才有机会走向AGI,才有机会与前沿技术较量”。
“到目前为止,还没有看到Scaling Law会失效的预兆,未来相当一段时间之内Scaling Law仍然会有效,当然这个有效也是一个动态概念,关键在于它本身所包含的事情会不断演进。”张鹏也赞同王小川的观点,称Scaling Law早期关注参数规模,现在慢慢扩展,参数量、数据量以及数据质量的重要性也被逐渐重视,“随着大家对规律的认知越来越深,逐渐揭示规律的本质,也就能逐渐掌握通往未来的钥匙”。
价格战是好是坏
5月下旬,当国产大模型激战“价格战”的时候,王小川曾表现出过一种“他强任他强,清风拂山岗”的淡定。当时被外界反复引用的一句话是王小川说的——“创业公司不在大厂射程内”。
从以“厘”为计算单位,到“掀桌子”全面免费,整个5月,大模型都陷入了被价格战支配的热潮之中,特别是阿里、百度、科大讯飞、腾讯云先后跟进,让大模型的价格战进入了白热化阶段。
但现在,王小川的态度有了些微妙的变化。北京智源大会上,王小川明确表示,当下的价格战对中国发展大模型而言是非常特别的一件事,“我积极看待这件事”。
李大海也认同,当前的价格战,虽然多少存在一定的营销成分,但未来一定会比现在的价格更低,“大家都有利润,才是健康的方式,才能真正让千行百业的应用落地”。
早于字节跳动大张旗鼓降价,智谱AI一度被认为是这轮价格战的发起方。大会现场,张鹏笑着澄清,“子虚乌有”。
张鹏说,从宏观角度看,降价能够促进大模型成为真正的基础设施,但张鹏也提到,不能过多地注意、甚至宣扬这件事,“做亏本买卖不是正常的商业逻辑,不可持续,最终还是要回归用户价值、生产力价值”。
回归价值本身,也是杨植麟的核心看法。他给出了三个判断,首先未来一个很重要的节点,是推理上的算力显著超过训练算力,这标志着价值开始得到释放。第二个重要节点,是C端推理成本显著低于获客成本,与之前的商业模式有了显著区别。在这两个前提之下,第三个关键在于,AI能做的事情可能会超过人做的事情,进而产生新的商业模式。
在接受北京商报等媒体群访时,智源研究院院长王仲远也不可避免地被问到了价格战的问题。王仲远认为,降价是件利弊并存的事。
一方面降价对于开发者开发应用场景,接入大模型做更多尝试,存在价值。但另一方面,如果降价持续且低于实际成本的话,很可能得不偿失。
“毕竟大模型迭代仍然需要巨大资金投入,而中国的大模型也不应该停留在GPT-4的水平,我们更乐于看到一个良好的产业生态健康地发展,这也意味着它需要找到自己的产业模式、商业模式。”王仲远说。
而对开发者,王仲远认为,选大模型应该优先考虑的不是性价比,而是性能。王仲远说:“在此基础之上,我相信价格最终都会回归到合理的水平。而且对于好用的大模型来说也存在规模效应,如果使用规模上去了,工程师们自然有条件做工程系统上的优化,价格也会自然而然下降,从而避免出现劣币驱逐良币。”
北京商报记者 杨月涵