ChatGPT 之父被罢免，大模型市场风云变幻，国内品牌纷纷入局

aizixun8 · 发表于 2024-9-19 02:41:38

除了“游戏之父”奥特曼被董事会罢免外，这几天关于大模型的新闻多次充斥屏幕。先是马斯克旗下的人工智能初创公司 xAI 推出首个人工智能模型 Grok，公开挑战它，随后又转身抛出“王者炸弹”，GPT-4 Turbo、自定义 GPT 和 GPT 商店相继出现，震惊整个行业。随后，一场 DDoS 攻击导致全球宕机，它不得不宣布推迟推出新功能，并暂停新 Plus 注册。

国内大机型市场也沸腾起来。智联金融、马上消费等相继发布金融大机型，OPPO、小米、vivo等正式宣布“上线”大机型，美的、长虹、TCL等家电品牌也纷纷开始研发自家大机型……在“机型热”如火如荼之时，百度CEO李彦宏直言“国内大机型太多，应用太少”，再度引发热议。GPT生态“碾压”的背后，是对大机型未来的思考。

马斯克战胜“Grok”的几率有多大？

马斯克的高调入局无疑将进一步加剧大车型的竞争。业内人士猜测，马斯克选择此时发布车型，是为了“反击”。不过，相比之下，Grok 入局较晚，很难评估其胜算。

近日举行的首届开发者大会吸引了众多关注，比如全新升级的GPT-4 Turbo支持128k上下文，但价格降低了2/3，冲击了现有的商用服务价格；新推出的GPT将大模型从技术推向商业化，这是产业发展的关键一步。

创始人Sam回顾了迄今为止取得的成绩，他表示：“目前为止，我们拥有大约200万的开发者，他们在我们提供的API上构建了各种应用，取得了惊人的成绩。超过92%的世界500强企业都在使用我们的产品作为基础，此外，我们的周活跃用户已经达到约1亿。”这些数据意味着，在构建大规模商业闭环的过程中，我们成功吸引了付费意愿和需求最高的客户群体。

但也不是十全十美的。北京计算机学会数字经济专业委员会秘书长王娟对《中国电子报》表示：“对新事物的认识存在盲区和漏洞，很多测试开始是‘喂数据’给模型去诱导结果，甚至大型模型也会出现偏差。”

“生成式AI的市场应用还处于早期阶段，一切皆有可能。”副总裁、研究总监戴昆在接受《中国电子报》记者采访时分析道，“xAI的业务格局融合了大模型、社交平台、自动驾驶和脑机接口等不同领域，差异化的生态能力为Grok未来的发展提供了独特的发展可能性。”

根据已经公布的一些测试数据，Grok 在 GSM8k（中学数学词汇）、MMLU（多学科选择题）、（代码补全）、MATH（初中数学）等多项数学和推理能力基准测试中的表现都优于 GPT-3.5。虽然距离 GPT-4 还有或多或少的距离，但作为第一个正式发布的公测版本，Grok-1 已经取得了非常显著的进步。

在训练数据方面，GPT-4 在训练数据的广度和深度方面有显著的先发优势，而且在被调用时还能实时搜索 Web 数据，而这是 Grok 所不具备的。Grok 的差异化优势在于，它能够更高效地访问 X 平台（即前者）上的信息，这让 Grok 拥有了实时社交平台数据洞察和多样化的生成风格。

“模型基于海量、实时、独特的数据，可以实时从推文中获取最新知识，主要特点就是实时，也就是模型还在不断学习更新。同时，Grok 的语言风格不寻常的幽默，其中马斯克的个人风格凸显出来。开发语言是 Rust，结合了新的深度学习框架 JAX。分布式架构让系统可以规避大模型的系统性风险。”王娟说。

“Grok不一定定位为GPT的竞争对手，GPT的定位是面向全场景的AI平台，而Grok更多的是适合X的大模型应用平台，二者定位不同，Grok是个很好的补充。”开放原子开源基金会TOC主席谭忠义对《中国电子报》记者表示。

GPT 生态系统多项选择题：开源还是闭源？

无论是Grok与的对决，还是国内各大模型之间的竞争，想要脱颖而出，生态建设都是重中之重。这也是阿里云、腾讯等厂商急于开模型店的根本原因。

“样板店在理念上和国内大部分厂商的战略规划一致，都希望通过样板店构建生态，一方面方便中小厂商引流，另一方面更利于客户的选择以及开发者与厂商之间的协同，从而围绕GPT大样板实现更强的黏性，最终带动收入增长。”戴坤说。

但同时他也指出，由于各厂商本身的市场定位和发展策略不同，在车型覆盖范围、车型集成机制、客户群体、针对的细分行业及业务场景、底层云平台的选择、与相关云服务的集成、计量计费、许可和定价模型等各方面肯定会存在差异。

“虽然他们都想做模型店，但他们想做的模型店和腾讯、阿里等的模型店有很大不同。腾讯和阿里云提供的是MaaS服务（模型即服务），他们的模型店支持各种不同的模型（既有开源的模型，也有闭源的模型）；阿里云则在其闭源模型上，依托自己提供的底层模型，提供各种定制化服务。”谭忠义说。

如同目前仍在进行的iOS与之争，大模型生态建设也面临开源还是闭源的选择。谭忠义认为，“是闭源，Meta是开源，未来大模型生态将是开源生态与闭源生态竞争与合作并存的局面。”

国内方面，百川智能大模型、智源AI大模型、腾讯混元大模型、阿里云统一千文大模型等均宣布加入开源“大军”，而华为盘古大模型、百度文言等均选择闭源。

戴坤指出，与传统技术领域不同，大模型的开源包括很多不同的层次，包括模型架构、模型预训练的代码和超参数、预训练的模型权重和参数、模型评估的输入数据预处理代码和模型评估代码、全流程配置和开发文档、API和插件接口、授权方式等。保持开放的接口和插件体系、开放的文档和有限的开源商业许可是必然选择，而其他层次的开源则可根据市场发展动态进行选择。

“样板商店会带来更广泛的数据和商业模式，如果开源能够提供闭源无法替代的活力，促进发展，当然好。但如果只是增加短期响应负荷、同质化产品竞争，对技术和商业价值没有太大意义，闭源也好。”王娟说。同时她指出，至少目前的目的并不是纯粹的商业化，腾讯、阿里的样板商店是想用样板利润和定价，带动支撑的应用层，以及云、硬件产业链市场。

百川智能创始人兼CEO王小川表示，未来开源和闭源会像苹果和安卓系统一样，并行发展，大部分服务会依赖开源模式，闭源会提供特定的增值服务，开源模式提供80%，闭源模式提供剩下的20%。

典范生态系统该如何构建？

到目前为止，赛道已经挤满了各类玩家，无论是通用大模型还是行业垂直大模型，包括互联网科技公司、AI科技公司、手机厂商、家电厂商、金融机构、文娱公司、教育机构等跨界玩家。这体现了行业对大模型的极大热情和信心，但也说明行业尚未形成真正有吸引力、有竞争力的模型生态。

谈及构建模型生态的关键要素，戴坤表示，模型自身能力、厂商的平台能力、生态运营能力缺一不可。首先，模型要具备优异的性能、突出的多模态支持、良好的开放性和快速迭代、良好的开发环境、完备的文档和案例等；其次，厂商要具备平台能力，比如覆盖公有云、私有云、边缘云服务的全栈云原生能力平台，围绕模型的人工智能平台和数据管理的全生命周期平台，面向各行业细分业务场景的模型定制平台，从底层芯片到开发、上层应用的软硬件适配平台；此外，厂商还要具备生态运营能力，比如对国内外开源社区和产业联盟的贡献和影响力，对开发者从模型开发到工程实践的有效支持，以及企业业务和技术决策者的思想领导力等。

“头部厂商积累的数据客观上构成了模型生态竞争的基础，所以在生态建设上，字节跳动、腾讯、阿里等公司的核心竞争力更有优势。”王娟说。其实模型越多越好。现在国内非常流行大模型，而现有的大模型的愿景也大多是布局整个产业链。很多看上去不错的大模型其实本身不产生任何价值，还造成了算力、人力、财力的浪费。

根据专家预测，未来几十年与大模型相关的行业格局是：首先会有几家公司提供通用大模型服务，包括百度、阿里巴巴等；其次会有很多家公司提供行业大模型服务，包括金融、能源、制造等行业；最后会有数百家甚至数千家科技公司提供公司内部的私有大模型服务，用于知识管理、软件开发、供应链等特定场景。每个公司都会有很多大模型服务，大部分是部署在公司内部的私有大模型服务，少部分是访问公网的大模型 API 服务。

“要建立良好的生态环境，需要过硬的技术和商业能力。从国内大模型厂商来看，百度在技术实力上比较领先，腾讯、阿里云也有丰富的应用场景和良好的前景。”谭忠义说。但差距还是很明显的，比如中文数据集的数量和质量还远远落后于英文数据集，计算能力也受到很大限制，基于大模型的开发生态才刚刚起步。

“我们需要的大模式，是能够不断演进的大模式，是能够在此基础上产生良性生态（主动开发、良性竞争、技术与商业并重）的大模式。中国的大模式生态应该是闭源与开源相互竞争、相互合作的模式。”谭忠义说。

		自动登录	找回密码
密码			立即注册

ChatGPT 之父被罢免，大模型市场风云变幻，国内品牌纷纷入局

浏览过的版块