炸场硅谷,大模型“蒸汽机”迎来“瓦特时刻”

大模型这台蒸汽机,急需要一个“瓦特”

作者 | 曾响铃

文 | 响铃说

中国大模型又在包括硅谷在内的全球AI圈炸场了。

两天前,幻方量化旗下AI公司深度求索(DeepSeek),以及月之暗面相隔20分钟相继发布了自家最新版推理模型,分别是DeepSeek-R1以及Kimi 全新多模型思考模型k1.5,且都给出了非常详尽的技术报告, “中国双子星”很快引发全球AI圈的关注。

在社交软件X上,包括英伟达AI科学家Jim Fan在内的全球AI从业者纷纷发出了自己的感叹:

炸场硅谷,大模型“蒸汽机”迎来“瓦特时刻”

相关数据显示,区别于过往类o1-preview模型,这次两家中国公司正面硬刚OpenAI o1,发布的都是满血版o1,而Kimi k1.5还是具备视觉思考的多模态。

炸场硅谷,大模型“蒸汽机”迎来“瓦特时刻”

表面上,是中国大模型某种程度上又一次在技术能力上直起了腰,而全球AI从业者的“围观”,本质上则透露出业界对大模型这台“蒸汽机”能够尽快出现属于自己的“瓦特”的期许。

大模型这台蒸汽机,急需要一个“瓦特”

大模型对时代的意义,不亚于蒸汽机之于工业革命。

但正如蒸汽机是在发明之后,是经过一段时间的改进,尤其是瓦特的改进后才正在成为工业革命驱动力一样,大模型这台“蒸汽机”要想大展拳脚,还一直处在不断改进之中。

那个属于它的“瓦特”,还一直没有到来,所有从业者都在热切期待这个时刻。

参与的人越多,“瓦特时刻”出现的可能性就越大,只有一个遥遥领先的OpenAI未必符合业界的普遍期许,当出现了与之肩并肩的DeepSeek、Kimi,关键进化的可能性变得更大,炸场AI圈就成为普遍期待下的必然。

炸场硅谷,大模型“蒸汽机”迎来“瓦特时刻”

而回看DeepSeek与Kimi这对中国双子星,他们发布的模型呈现了很多相似之处,都侧重以强化学习(RL)为核心驱动力(即在仅有极少标注数据的情况下,极大提升模型推理能力)。

具体来说,二者在实现方式上都不需要进行像 MCTS 那样复杂的树搜索(只需将思维轨迹线性化,然后进行传统的自回归预测即可),也不需要配置另一个昂贵的模型副本的价值函数、不需要密集奖励建模,只尽可能多的依赖事实和最终结果。

很明显,这些,都在提升推理模型的运行效率、降低资源需求,而有意思的是,这同样是当年瓦特改造蒸汽机的方向,他在众多改造中最完美地实现了这些目标。

历史,总是惊人的相似。

值得一提的是,在这次中国双子星炸场的过程中,OpenAI萨姆·奥尔特曼也加入其中,只不过他发挥了一贯的“阴阳”技能,“AGI不会下个月就到来”,在一片赞誉甚至狂欢中,暗地里讽刺社交平台的关注是不是太过疯狂。

炸场硅谷,大模型“蒸汽机”迎来“瓦特时刻”

实际上,AGI确实不是短期能做到的,但这并不是制止全球从业者欢欣鼓舞的理由。蒸汽机花了很长时间才完成进化能够走入工厂,大模型也需要这样的过程才能实现对社会进步的全面赋能,也正因为如此,每一次对这个进程的缩短,都值得每一个从业者欣慰。

中国双子星,让业界看到“瓦特”的更多可能性

具体到技术层面,当仔细分析中国双子星尤其是Kimi的SOTA模型能力后,就会发现业界人士的惊喜有着充分的理由。

以“蒸汽机”类比,瓦特的改进首先是直接提升了运行效率,提升了蒸汽转化为机械动力的能力,从而能够由“试验装置”走向真正的“机器”。

这次发布的模型首先也是在推理能力上大幅跨越,发布的都是真正的“满血版o1”,而不是其他各家所发布的“准o1”,或者得分差得太远的o1,有着绝对实力上的领先而非只是小小的一次迭代。

更进一步看,瓦特对蒸汽机的改进还在机器对不同生产环境的适应能力上进行了改造,对应到大模型这里,则是推理大模型的多模态进化。

目前,DeepSeek R1只能识别文字、不支持图片识别不同,Kimi k1.5则能进行一步多模态推理,且在数学、代码、视觉等复杂任务上的综合性能提升,成为OpenAI之外首个多模态类o1模型。

以Kimi k1.5为例:

一方面模型在数学和代码能力上的推理能力和正确率(诸如 pass@1、EM等指标)大幅领先或赶超其他主流对比模型;

另一方面模型在在视觉多模态任务上,无论是对图像中信息的理解、还是进一步的组合推理、跨模态推理能力,都有显著提升。

截取Kimi的发布Paper原文,其长文本处理能力大幅提升,支持高达128ktokens 的 RL生成,采用部分展开方式进行高效训练,且在训练策略上有包括在线镜像下降法等在内的多项改进。

在长思考模式(long-CoT)下,Kimi K1.5在数学、编程和视觉任务中的表现与OpenAI o1的性能水平接近。

炸场硅谷,大模型“蒸汽机”迎来“瓦特时刻”

而到了短思考模式(short-CoT)下,Kimi k1.5 更是让业界惊喜,做到了某种程度上的“遥遥领先”,其数学、代码、视觉多模态和通用能力,大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,领先达到550%。

炸场硅谷,大模型“蒸汽机”迎来“瓦特时刻”

这种领先,得益于Kimi k1.5独特的“Long2Short”训练方案,顾名思义,即先利用较大的上下文窗口让模型学会长链式思维,再将“长模型”的成果和参数与更小、更高效的“短模型”进行合并,然后针对短模型进行额外的强化学习微调。

这种做法,最大化保留了原先长模型的推理能力,避免了常见的“精简模型后能力减弱”难题,又能同时有效挖掘短模型在特定场景下的高效推理或部署优势,是一次推理模型的重要创新。

“Long2Short”训练方案在算力与性能平衡方面实现了成功探索,改变了OpenAI o1以时间换空间的做法(牺牲实际应用时的用户体验来提升性能,这种做法一直存在争议),有业界人士表示将会是未来新的研究方向。

而从更宏观的视角看,这样的创新,除了给Kimi带来更亮眼的模型表现,毫无疑问也在让大模型“蒸汽机”的“瓦特时刻”变得越来越近。

更密集的突破,才能争抢“瓦特”

Kimi k1.5的出现显然不会是一蹴而就的,是多次进化迭代的结果,但最令人关注的,是迭代的速度。

仅仅在三个月前的2024年11月,月之暗面就推出了初代版本的Kimi K0-math。过了1个月,k1视觉思考模型诞生,继承了K0-math的数学能力,又成功解锁了视觉理解能力,“会算”+“会看”。紧接着又1个月后,也就是这次的K1.5发布,在数理化、代码、通用等多个领域中,刷新了SOTA,直接媲美世界顶尖模型。

三个月三次突破,密集创新迭代才带来炸场的效果与成果。

在关键的历史节点,业界期待“瓦特”,与此同时,业界也在争当“瓦特”,大模型只会越来越卷。

就在中国双子星炸场后,美国总统特朗普宣布OpenAI、甲骨文和软银将联合推进一项称之为Stargate(星际之门)的项目,要在人工智能基础设施领域投资至少5000亿美元,大国AI竞争已经白热化。

好在,无论是基础设施的建设,还是以中国双子星为代表的模型能力建设,中国都已经抢占了先机,这一次不会再处于被动地位——在Kimi的规划中,其将继续发力多模态推理,快速迭代出更多模特、更多领域、更具备通用能力的Kn系列模型。

相信,大模型的“瓦特时刻”,同样会是中国大模型赢得话语权的时刻。

*本文图片均来源于网络

*此内容为【响铃说】原创,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

#响铃说 Focusing on企业数字化与产业智能化升级,这是关注一切与创业、产业和商业相关的降本增效新技术、新模式、新生态 NO.435深度解读

【完】

曾响铃

1钛媒体、人人都是产品经理等多家创投、科技网站年度十大作者;

2 虎啸奖评委;长沙市委统战部旗下网络名人联盟成员;

3 作家:【移动互联网+ 新常态下的商业机会】等畅销书作者;

4 《中国经营报》《商界》《商界评论》《销售与市场》等近十家报刊、杂志特约评论员;

5 钛媒体、36kr、虎嗅、界面、澎湃新闻等近80家专栏作者;

6 “脑艺人”(脑力手艺人)概念提出者,现演变为“自媒体”,成为一个行业;

7 腾讯全媒派荣誉导师、功夫财经学者矩阵成员、多家科技智能公司传播顾问。

本文来自投稿,不代表创造权威IP 赋能创业者——IP百创立场,如若转载,请注明出处:创造权威IP 赋能创业者——IP百创

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年1月22日 下午5:32
下一篇 2025年1月23日

相关推荐

  • 中国电建增资至172亿

    天眼查App显示,近日,中国电建发生工商变更,注册资本由约151.46亿人民币增至约172.26亿人民币。 中国电力建设股份有限公司成立于2009年11月,法定代表人为丁焰章,主营业务为工程承包与勘察设计、电力投资与运营、房地产开发、设备制造与租赁等,由中国电力建设集团有限公司、中国证券金融股份有限公司、香港中央结算有限公司等共同持股。 天眼查信息:http…

    2024年8月26日
  • 苏杉杉起诉丝芭传媒

    #苏杉杉因合同纠纷案件起诉丝芭# 天眼查法律诉讼信息显示,近日,苏杉杉与上海丝芭文化传媒集团有限公司其他合同纠纷案件新增开庭公告,原告为苏杉杉,该案将于8月14日在上海市虹口区人民法院开庭审理。 据悉,苏杉杉为女子偶像团体SNH48六期生,SNH48 Team NII、浪彩少女AW9成员。涉诉关系显示,上海丝芭文化传媒集团有限公司曾与多位SNH48原成员存在…

    2024年7月23日
  • 左手依赖博世,右手绑定大客户,车联天下的赴港IPO突围战

    新能源汽车的下半场就是智能汽车,而智能汽车的发展离不开智能座舱。截至2025年,中国新车的智能座舱渗透率已经高达73%以上,这意味着每卖出10辆车,就有7辆配备了智能座舱,市场已经从“教育用户”阶段进入了“普及深化”阶段。 2024年,中国乘用车智能座舱解决方案市场规模已经达到了1290亿元。不过根据预测,到2029年这一市场规模将增长到近3000亿元,CA…

    2025年12月29日
  • 巨亏转盈?极兔是真的猛!

    “收一单亏一单”,曾经是很多人对极兔的刻板印象。作为国内快递业的一匹黑马,行业中的“后起之秀”,极兔在过去三年的增长极其迅猛。据公开资料显示,从2020年到2022年的三年间,其收入就从15.32亿美元,增长到了72.67亿美元,其年复合增长率几乎达到了50%。 在营收规模快速扩张的同时,其亏损也在快速放大。招股书显示,2020年至2021年,极兔速递年内亏…

    2024年9月6日

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

邮件:939297903@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信