李彦宏发声!“商业化的闭源模型最能打”
摩天一人虐
发表于 2024-7-4 18:09:00
1125
0
0
他表示,开源大模型在学术研究、教学领域等特定场景下有存在的价值,但并不适用于大多数应用场景。“当你处在激烈竞争的环境中,需要让业务效率比同行更高、成本比同行更低。这时,商业化的闭源模型是最能打的。”
李彦宏表示,今年以来,开源和闭源大模型是一个争议较大的话题,但很多人混淆了模型开源和代码开源的概念。“模型开源只能拿到一堆参数,还要再做SFT、安全对齐。即使拿到对应源代码,也不知道用了多少比例、什么比例的数据去训练这些参数,无法做到‘众人拾柴火焰高’,并不能让你站在巨人的肩膀上迭代开发。”
李彦宏直言,同样的参数规模下,开源模型能力不如闭源,“如果开源(模型)能力想追平闭源(模型),需要有更大的参数规模,这意味着推理成本更高、反应速度更慢。很多人拿开源模型来做改款,以为这样可以更好服务自己的个性化需求,殊不知这就变成了一个孤本模型,既无法从基础模型的持续升级中获益,也没办法跟别人共享算力。”
李彦宏称,开源模型在一些学术研究、教学领域有存在价值,可以用于研究大模型的工作机制,形成理论。但开源模型并不适用于大多数应用场景,在激烈的商业环境中,想要让业务效率高于同行、成本低于同行,商业化的闭源模型是“最能打的”。他以百度在小说创作上的实践为例,当从开源模型转向轻量级模型、再转向文心大模型4.0后,小说生成的可用率和优质率得到极大提升。
李彦宏认为,大模型的重点还是“应用”,“没有应用,光有基础模型,不管是开源还是闭源都一文不值。”
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。