百度发布文心4.5 Turbo、X1 Turbo两大模型,王海峰详解背后技术

4月25日,Create2025百度AI开发者大会在武汉举办。百度创始人李彦宏发布了文心大模型4.5 Turbo及深度思考模型X1 Turbo两大模型,以及多款AI应用。百度首席技术官王海峰现场详细解读了背后的技术。

百度发布文心4.5 Turbo、X1 Turbo两大模型,王海峰详解背后技术

两大模型连发!核心技术详解

王海峰介绍,文心大模型4.5是多模态基础大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低;基于文心4.5 Turbo,文心X1升级到X1 Turbo,性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强。在C-Eval、CMMLU、MathVista、Math500等多个基准测试集中,文心4.5 Turbo和X1 Turbo跟DeepSeeK与GPT模型相比,效果在伯仲之间。

百度发布文心4.5 Turbo、X1 Turbo两大模型,王海峰详解背后技术

大会现场,王海峰从基础模型、后训练、深度思考和数据等方面解读了文心4.5 Turbo和X1 Turbo的关键技术。

文心4.5和4.5 Turbo都是多模态大模型,实现了文本、图像和视频的混合训练。针对不同模态数据在结构、规模、知识密度上的差异,通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术,大幅提升跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态理解效果提升超过30%。

后训练方面,百度研制了自反馈增强的技术框架,基于大模型自身的生成和评估反馈能力,实现了“训练-生成-反馈-增强”的模型迭代闭环,不仅解决了大模型对齐过程中,数据生产难度大、成本高、速度慢等问题,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。

在训练阶段,研制了融合偏好学习的强化学习技术,通过多元统一奖励机制,提升了对结果质量判别的准确率,通过离线偏好学习和在线强化学习统一优化,进一步提升了数据利用效率和训练稳定性,并增强了模型对高质量结果的感知。得益于偏好信号与奖励信号的融合运用,模型的理解、生成、逻辑和记忆等能力全面提升。

深度思考方面,突破了仅基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,模型解决问题能力得到显著提升。同时,结合多元统一的奖励机制,实现了思考和行动链的端到端优化,大幅提升了跨领域的问题解决能力。

数据方面,打造了“数据挖掘与合成 – 数据分析与评估 – 模型能力反馈”的数据建设闭环,为模型训练源源不断地生产知识密度高、类型多样、领域覆盖广的大规模数据。同时,数据建设流程具备良好的可扩展性,能够轻松迁移到全新的数据类型,实现快速、高效的数据生产。

文心快码发布3.5版本,累计服务760万开发者

基于文心大模型的语言和代码能力,百度研制了代码智能体和智能代码助手——文心快码。代码智能体,基于智能体的理解、规划、反思,以及工具调用能力,用自然语言对话,即可实现应用的自动开发,并支持多轮交互,迭代优化代码质量,实现了无代码编程,让人人都可以成为程序员。

智能代码助手,帮助专业的程序员更高效地写出更好的代码。据介绍,文心快码3.5版主要突破了四大核心能力:一是代码智能体引擎,支持多模态编程、开发工具调用、应用预览,实现「需求-编码-调试-验证」端到端生成;二是代码预测改写引擎,新增光标预测与多行智能改写,可精准实现复杂的代码的增加、删除和修改;三是上下文引擎,结合文心4.5和X1的推理能力,更懂开发者意图,回答问题更准确;最后是更开放的研发生态,通过MCP接入协议,全面兼容主流开发工具链。目前百度每天新增的代码中,文心快码生成的代码占比已超过40%。最新数据显示,文心快码向全社会开放,累计服务760万开发者。

飞桨文心联合优化,开发者已达2185万

文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化。比如,训练方面,多模态统一的掩码注意力加速,在不同模态混合计算注意力时,显著降低掩码构建和计算开销,大幅提升训练性能;推理方面,多模态流式分块预填充机制,减少首token耗时,同时减少推理计算的显存峰值,提升推理批次大小,提升吞吐性能。通过这些联合优化技术,文心4.5 Turbo训练吞吐达到文心4.5的5.4倍,推理吞吐达到8倍。

从现场我们了解到,飞桨框架3.0既延续了动静统一、训推一体的技术特色,更在自动并行、神经网络编译器、高阶自动微分等方面创新突破。例如,动静统一自动并行,使得大模型分布式训练代码减少80%;大模型训推一体,帮助强化学习训练提速114%;科学计算高阶微分,微分方程求解速度比 PyTorch 快115%;神经网络编译器,提升框架通用性能,模型端到端训练速度提升27%;异构多芯适配,飞桨已适配国内外60多个系列芯片。

百度发布文心4.5 Turbo、X1 Turbo两大模型,王海峰详解背后技术

截至目前,飞桨文心开发者数量已超过2185万,服务超过67万家企业,创建的模型达到110万。

大模型让文博知识触手可及,首个“非遗武术大模型”发布

随着人工智能技术加速进步,大模型在千行百业的应用也越来越深入。例如,在文博领域,百度与中国文物交流中心达成深度合作,增强大模型在文博领域专业知识,并发布首个文博智能体,用AI的力量让文博知识触手可及,让每个人都成为文博传承的参与者与受益者;在非遗武术传承领域,百度与上海体育大学武术学院、中国武术博物馆馆联合发布“非遗武术-百度文心大模型”,基于文心大模型,融合上海体育大学武术学院、中国武术博物馆的专业积淀,将武术技法与算法结合,通过3D动作建模、AI动态纠错等技术,将非遗武术技术动作以数字化的形式保存和记录下来。

活动最后,第十二届百度奖学金颁奖典礼在现场举办。作为国内外AI领域资助金额与含金量最高的学术奖学金之一,百度奖学金自2013年设立以来,已累计发放超千万元资金。王海峰为来自全球顶尖高校的10位获奖选手颁发奖学金,每人20万元。这不仅是对获奖选手学术成果的认可,也彰显了百度对AI人才培养的长期承诺。

本文来自投稿,不代表创造权威IP 赋能创业者——IP百创立场,如若转载,请注明出处:创造权威IP 赋能创业者——IP百创

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年4月25日 下午3:11
下一篇 2025年4月25日 下午5:55

相关推荐

  • 00后记者挑战做直播3场赚4千,这是什么概念?背后的一点思考

    近日,倪叔听说了一件有趣的事,有00后记者深入产业带做淘宝直播带货,看看做3场直播能赚多少钱。 结果是,3场直播GMV有1.3W,算上各种租金、拿货价、快递等,一共赚了4千。如果按一个月22场直播计算,就能赚2-3W的样子。 不过,这是理想的状态。这位有想法的00后记者找到了自己的远房表哥,在当地做淘宝直播专门卖羊毛衫,有深厚的货品资源,和厂家的关系好到能拿…

    2022年12月16日
  • #中国国新等成立股权投资基金# 出资额50亿

    天眼查App显示,近日,国新能发(北京)股权投资基金合伙企业(有限合伙)成立,执行事务合伙人为国风投创新私募基金管理有限公司、北京国新能源发展有限公司,出资额约50亿人民币,经营范围为以私募基金从事股权投资、投资管理、资产管理等活动。合伙人信息显示,该基金由中国国新旗下国新发展投资管理有限公司、北京国新能源发展有限公司、国风投创新私募基金管理有限公司、国风投…

    2024年9月25日
  • 被诉侵权常州小米之家已更名

    #小米起诉常州小米之家商标侵权# 据报道,4月21日,江苏常州中院公开审理了小米科技公司诉常州小米家居有限公司侵权一案。2012年,常州王某在地板等商品上申请“小米之家”商标,并于2015年完成注册,后授权常州小米家居有限公司使用。小米认为被告的行为构成不正当竞争,要求判决被告立即停止使用商标并变更企业名称。 天眼查App显示,今年2月,常州小米家居有限公司…

    行业动态 2023年4月24日
  • 贵州茅台诉两酒企侵权索赔20万

    #贵州茅台维权索赔20万# 天眼查法律诉讼信息显示,近日,成都市锦江区人民法院向贵州赖贵初酒业有限责任公司、贵州省仁怀市茅台镇千喜年酒业有限公司公告送达原告贵州茅台酒股份有限公司与上述两公司侵害商标权纠纷案件起诉状副本、开庭传票、应诉通知书等。公告内容显示,原告贵州茅台请求判令两被告立即停止在“茅台镇原浆酒”上使用侵害原告第284526号、34474107号…

    2024年9月6日
  • AIGC浪潮“卷”至广告业,支付宝推出AI创意生成平台“蚂上有创意”

    近日,支付宝推出AI创意生成平台“蚂上有创意”,面向商家机构提供AI快速生成创意素材、营销广告智能分析等营销服务,同时免费开放价值上亿的营销图片素材,商家可在浏览器输入网址idesign.alipay.com或搜索“蚂上有创意”,即可登陆平台后申请使用。据了解,过去一年支付宝将AI全面应用于商业开放生态,共接入近70个业务场景,累计为生态商家机构生成8700…

    行业动态 2024年12月20日

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

邮件:939297903@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信