被认可的大模型价格战

　　来源：北京商报

　　作为开幕式最后一个环节的嘉宾、月之暗面CEO杨植麟刚走下台就被团团围住，杨植麟一边为难地重复着“以后还有机会”，一边在工作人员的帮助下匆忙离场。这是外行爱看的热闹。6月14日，北京智源大会开幕。我们在离杨植麟最近的地方，见证了一次大模型的“追星”现场。

　　当天，杨植麟和百川智能CEO王小川、智谱AI CEO张鹏、面壁智能CEO李大海进行了一场尖峰对话。这是内行爱听的门道。

　　两个场景，是中国AI市场由表及里、由外向内的写照。两者相连，既是现在，也是未来。

被认可的大模型价格战第1张

　　什么是AGI

　　大模型的突破，让人类通往AGI的终极幻想有了更大的可能。但对于AGI本身，业内似乎并没有统一定义。

　　杨植麟认为，当下AGI或许并不一定需要一个精确的、量化的定义，它也可能是一个定性且感性的存在，它的意义在于让社会或者人类对接下来要发生的事情有一个准备。不过杨植麟认为，在短期内，确实需要这样一种量化的定义，“因为如果完全没有量化，也自然无法衡量AGI开发的进度，从而影响整体发展”。

　　张鹏也更愿意相信，AGI是一种信念，一种符号，其内涵外延是在不断变化的。如果能把一件事情说得非常量化、非常清晰，那么天花板估计也就触手可及了。张鹏认为，对人工智能的发展而言，没人能够说清楚什么是AGI，反而可能是一件好事，这意味着还有更多未知空间等待探索。

　　王小川试图从“人”的角度理解AGI，即大模型能不能“造医生”。之所以选择这一指标，是因为AGI的第一个变化是大模型开始具有思考、学习、沟通、共情甚至多模态处理能力，就像是医生，既需要多模态，也需要减少幻觉，同时需要有强大的记忆能力、查文献能力、推理能力，如果把行业上能共识的能力都投射到做医生的标准中，那么这便可以成为一个指标——“人造医生”就是AGI。

　　李大海则尝试从经济学的角度定义AGI。在他看来，一个理想中的AGI，就是去执行任何任务的时候，边际成本都已经降为0。去年行业里大家推动大模型落地时，很多场景还需要做微调，这个过程的边际成本就很高。“我们相信，随着模型能力的提升，大模型门槛越来越低，成本也越来越接近于0的时候，AGI基本也就到来了。”

　　Scaling Law还是“信条”吗

　　大会上，一个词被反复提及——Scaling Law，这个类似于大模型版的“大力出奇迹”的法则，成功塑造出了OpenAI。但随着时间的推移以及AI的发展，这个参数越多模型越强的黄金法则，也逐渐陷入了摩尔定律一般是否接近失效的讨论。

　　杨植麟认为，Scaling Law本质上没有问题，只要有更多算力、更多参数，就会持续演进。但在这个过程中，如果一直沿用现在的方法，上限是很明显的，更关键的在于如何更高效地实现Scaling Law。

　　王小川也认为，在Scaling Law之外，一定要在数据、算法、算力等方面寻找范式上新的转化，“不论是战略上还是信仰上，我认为Scaling Law之外都还有范式变化的可能，不只是去简单地变成压缩模式，而是会走出一个体系，这样才有机会走向AGI，才有机会与前沿技术较量”。

　　“到目前为止，还没有看到Scaling Law会失效的预兆，未来相当一段时间之内Scaling Law仍然会有效，当然这个有效也是一个动态概念，关键在于它本身所包含的事情会不断演进。”张鹏也赞同王小川的观点，称Scaling Law早期关注参数规模，现在慢慢扩展，参数量、数据量以及数据质量的重要性也被逐渐重视，“随着大家对规律的认知越来越深，逐渐揭示规律的本质，也就能逐渐掌握通往未来的钥匙”。

　　价格战是好是坏

　　5月下旬，当国产大模型激战“价格战”的时候，王小川曾表现出过一种“他强任他强，清风拂山岗”的淡定。当时被外界反复引用的一句话是王小川说的——“创业公司不在大厂射程内”。

　　从以“厘”为计算单位，到“掀桌子”全面免费，整个5月，大模型都陷入了被价格战支配的热潮之中，特别是阿里、百度、科大讯飞、腾讯云先后跟进，让大模型的价格战进入了白热化阶段。

　　但现在，王小川的态度有了些微妙的变化。北京智源大会上，王小川明确表示，当下的价格战对中国发展大模型而言是非常特别的一件事，“我积极看待这件事”。

　　李大海也认同，当前的价格战，虽然多少存在一定的营销成分，但未来一定会比现在的价格更低，“大家都有利润，才是健康的方式，才能真正让千行百业的应用落地”。

　　早于字节跳动大张旗鼓降价，智谱AI一度被认为是这轮价格战的发起方。大会现场，张鹏笑着澄清，“子虚乌有”。

　　张鹏说，从宏观角度看，降价能够促进大模型成为真正的基础设施，但张鹏也提到，不能过多地注意、甚至宣扬这件事，“做亏本买卖不是正常的商业逻辑，不可持续，最终还是要回归用户价值、生产力价值”。

　　回归价值本身，也是杨植麟的核心看法。他给出了三个判断，首先未来一个很重要的节点，是推理上的算力显著超过训练算力，这标志着价值开始得到释放。第二个重要节点，是C端推理成本显著低于获客成本，与之前的商业模式有了显著区别。在这两个前提之下，第三个关键在于，AI能做的事情可能会超过人做的事情，进而产生新的商业模式。

　　在接受北京商报等媒体群访时，智源研究院院长王仲远也不可避免地被问到了价格战的问题。王仲远认为，降价是件利弊并存的事。

　　一方面降价对于开发者开发应用场景，接入大模型做更多尝试，存在价值。但另一方面，如果降价持续且低于实际成本的话，很可能得不偿失。

　　“毕竟大模型迭代仍然需要巨大资金投入，而中国的大模型也不应该停留在GPT-4的水平，我们更乐于看到一个良好的产业生态健康地发展，这也意味着它需要找到自己的产业模式、商业模式。”王仲远说。

　　而对开发者，王仲远认为，选大模型应该优先考虑的不是性价比，而是性能。王仲远说：“在此基础之上，我相信价格最终都会回归到合理的水平。而且对于好用的大模型来说也存在规模效应，如果使用规模上去了，工程师们自然有条件做工程系统上的优化，价格也会自然而然下降，从而避免出现劣币驱逐良币。”

　　北京商报记者杨月涵