千行万业共“昇腾”,人工智能新范式正在发生

AI时代,Tokens成为新的衡量标准,2024年年初,中国日均Token消耗量为1千亿,今天每日消耗量已达到了十万亿级,1年增长100倍。”华为昇腾计算业务总裁张迪煊,在昇腾人工智能伙伴峰会上这样说。

千行万业共“昇腾”,人工智能新范式正在发生

华为昇腾计算业务总裁张迪煊作《与时代 共昇腾》演讲

庞大Token消耗量背后,反应的是当下中国正在进入一个“AI应用的黄金期”。不过,大模型落地并非一蹴而就的。再聪明的大模型也仅是“缸中之脑”,想要引发山呼海啸的AI变革浪潮,仍需要有人为其提供大量的配套支持。

种种迹象表明,2025年正在成为AI应用元年。但谁又在为千行万业智能化转型按下加速键呢?

将DeepSeek“搬”出实验室

DeepSeek绝对会在中国AI发展史上,留下浓墨重彩的一笔。其DeepSeek性能优越,被一些美国人称为“人工智能的斯普特尼克时刻”,认为它的威力不亚于冷战期间苏联发射首颗人造卫星“斯普特尼克1号”,对美国产生的冲击。

尽管DeepSeek“聪明绝顶”,但在发布之初其距离“人人使用”的“国民大模型”仍有较大距离。原因有二:

一是,DeepSeek的满血版模型(V3和R1)参数高达6710亿,单机部署需多块高性能GPU比如需要8卡并行才能部署,而国产AI芯片在多机互联技术尚未完全突破,导致满血版模型在端侧部署困难;

二是,DeepSeek专注于文本生成与推理,本身缺乏多模态能力,在医疗影像诊断、工业质检中适配性受限。

这些问题得不到解决,DeepSeek便只是个聪明一点的“Chat Bot”。中国企业则又会陷入“守着金山要饭吃”的尴尬窘境。但好在 “开源” 的优势为解决这些困境带来了转机。

在演讲中,我们看到了DeepSeek掀起的“春节攻势”背后的一系列昇腾行动:

在春节第一时间,昇腾和伙伴硅基流动共同作战,迅速面向全国用户第一时间提供DeepSeek的线上服务,解决了用户因本地部署困难而无法使用 DeepSeek 的燃眉之急;

春节后的2周,昇腾围绕融合算子、通信优化、并行加速、推理系统、强化学习五大方向实现工程技术创新,让一体机性能翻番,同时昇腾率先完整复现Open-R1后训练全流程,并将能力沉淀成套件和解决方案,开放给伙伴,让更多企业能够利用DeepSeek 开发出符合自身业务需求的创新应用;

春节后的一个月,已经有超过80个伙伴基于昇腾落地大模型应用一体机、国内25城人工智能计算中心都上线DeepSeek。150多家企业基于昇腾快速部署上线DeepSeek。

从实验室技术到应用成果遍地开花,昇腾只用了1个月的时间。

为什么是昇腾?

在笔者看来,这场行动透露出昇腾在推动AI加速落地上的三个“度”。

第一个“度”,是支撑的“速度”,围绕大模型的适配和性能释放,昇腾可谓是马不停蹄,争分夺秒地进行快速响应、技术创新以及生态协同,在支撑AI落地千行万业上成了引领者。

第二个“度”,是创新的“深度”,围绕AI落地所出现的新问题,昇腾进行深度、全面的技术创新,保驾护航。例如困扰很多企业部署类MoE大模型面临的算力成本高、并发能力弱、内存瓶颈显著等问题,昇腾推出了大规模专家并行解决方案。通过将MoE模型的多专家权重数据分散部署到更多的卡上,降低单卡权重加载时延,让模型解码输出更快;同时,单卡可提供更大内存容量支持更大用户并发所需的KV缓存,实现系统的更大吞吐性能,推理引擎支持从单卡加速到大规模专家并行集群的极致加速。这个方案的本质是通过全栈技术的协同优化,突破混合专家模型在大规模部署中的效率瓶颈,实现性能、成本和资源利用率的最优平衡。

第三个“度”,是场景的“广度”,在AI部署上,昇腾的创新是围绕企业客户的不同场景痛点进行创新,并助力伙伴抓住AI应用爆发的全场景。例如,围绕企业轻量化部署AI的需求,昇腾助力伙伴基于昇腾发布一体机,从模型部署、推理加速到应用上线,昇腾能为伙伴提供了业界领先的方案支持,量化、调优等工具链显著提升50%部署效率;围绕大吞吐、低时延等高要求业务场景,昇腾携手科大讯飞率先实现大规模专家并行集群推理解决方案;为了满足客户打造专属“行业R1”模型的需求,昇腾率先打通从微调、蒸馏到强化学习的全流程,将能力沉淀至MindSpeed-RL套件等等,都是这样。

“技术创新+生态开放”双轮驱动,与行业“共昇腾”

《与时代 共昇腾》的演讲透露了更多昇腾的相关信息和最新进展。

在昇腾人工智能伙伴峰会上,昇腾发布业界首个强化学习开发套件MindSpeed RL,其通过全栈技术创新和开源生态支持,解决了传统强化学习在大模型应用中面临的核心难题,全流程的工具链支持助力开发者无需从零构建复杂流程,显著缩短开发周期,而算法与框架同源支持企业快速复现训练流程,甚至适配千亿级MoE模型的强化学习需求。同时,训推共卡技术、异步流水调度优化等技术创新,实现了大模型RL训练的“性能-效率-成本”平衡。

更重要的是,MindSpeed RL在Gitee上开源,其意义在于通过技术解耦与生态开放,让强化学习不再是高门槛的科研工具,而是变成一种标准化生产力工具。用张迪煊的话来说,就是“让每个企业都有机会打造属于自己的‘R1模型’。”

这透露出昇腾的清晰运作模式,那就是“技术创新+生态开放”的双轮驱动:一个轮子进行全栈的技术创新,不断围绕客户和时代需要,攻克技术难题;另一个轮子是将技术创新开放给生态伙伴,赋能伙伴打造更有竞争力的产品和解决方案。

千行万业共“昇腾”,人工智能新范式正在发生

在过去的一年时间里,昇腾坚定围绕硬件、算子、加速库、模型及应用五大创新方向,携手伙伴,共同发展。今年,昇腾将持续加大生态投入,从技术、政策、生态及激励几个维度持续为伙伴提供支撑。

在昇腾人工智能伙伴峰会上,张迪煊公布了昇腾在双轮驱动上的诸多新进展。

例如,硬件使能层CANN深度开放,从上层图引擎到底层运行时,从融合算子到通信算法,释放硬件极致性能,使能伙伴及客户自主创新。

例如,推理引擎MindIE持续升级,vLLM开源社区与昇腾的对接,让开发者可以基于昇腾使用vLLM全量功能,而MindIE Turbo推理加速插件,可以为vLLM提供高阶优化,吞吐可提升20%以上,实现极致性能。

例如,鹏城实验室基于昇思发布GRPO强化学习训练框架,率先突破了大模型强化学习全栈技术壁垒。昇思持续演进自然与万千开发者的贡献息息相关。

例如,刚刚发布的昇腾自动驾驶SDK,就聚合了昇腾在自动驾驶数据闭环、模型“天”级迭代上的技术创新模型性能提升30%以上,而套件的模型和算子全量开源在Gitee上,并提供丰富的参考设计,很好地体现出“技术创新+生态开放”这个双轮驱动,所带给伙伴和客户在智驾训练上的价值。

显然,这种双轮驱动,是AI发展和应用的最优解,昇腾可以聚焦在自己最擅长的产品和技术领域,而不同行业、不同阶段的伙伴可以将自身对行业的洞察和积累与昇腾的技术创新相结合,实现差异化优势,共同在AI时代弄潮。

这就是“与时代共昇腾”的真实含义。

后记:AI行业新范式

这段时间,笔者在行业做了很多采访,一个深刻的感受是进入2025年,AI正在呈现出发展的新范式。

新范式之一,是从“训练为主”到“训推结合”,推理时代正在到来,对推理算力以及性能和收益提出了新要求。张迪煊指出,每次长思考的逻辑推理,都会带来额外20倍的token生成,随之而来的是百倍的推理算力需求。

新范式之二,是技术平权,AI的行业落地门槛在大大降低。正如张迪煊所说,AI自主创新的序幕已经揭开,高质量模型+后训练范式大幅提升行业模型效果,降低了行业落地门槛,推动2025进入大模型应用元年。

新范式之三,是中国自主AI生态迎来难得的发展机遇。中国在大模型上与全球并驾齐驱,而开源特性也大幅降低了AI落地行业的门槛,进而推动越来越多的企业、高校、科研机构和开发者加入,人工智能产业在中国迸发出越来越旺盛的创新活力。

站在这些人工智能产业范式革命的角度,再来看昇腾在全栈技术创新与生态开放协同上的一系列举措,可以清晰地看到,昇腾所做的一切,都抓准了AI范式革命的脉搏,通过技术创新实现AI算力释放在性能和收益上的最好平衡,通过生态开放推动技术平权,让AI加速进入千行万业。

与时代 共昇腾!”,不仅是华为提出的口号,更是昇腾生态伙伴以及千行万业加速拥抱AI的时代强音。

 

本文来自投稿,不代表创造权威IP 赋能创业者——IP百创立场,如若转载,请注明出处:创造权威IP 赋能创业者——IP百创

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年3月28日
下一篇 2025年3月29日

相关推荐

  • 看懂穿山甲AdSpark:广告投放的核心不是流量,是经营

    过去十年,是一个流量狂飙的十年,毫不夸张的说,整个市场因此被带偏,流量至上的思维使很多人错把手段当目的。 流量是手段,经营才是目的。广告行业也不例外,投流的本质是为了完成经营任务,实现商业价值的最大化。站在这一角度去看穿山甲全新升级而来的「AdSpark」,格局瞬间打开。 穿山甲「AdSpark」前身是「增长参谋」,定位数据分析,在人工智能、大模型等技术井喷…

    行业动态 2024年1月4日
  • 华统集团等成立国际供应链管理公司注册资本2.6亿

    天眼查工商信息显示,近日,浙江华翼国际供应链管理有限公司成立,法定代表人为朱俭勇,注册资本2.6亿人民币,经营范围包括供应链管理服务、海上国际货物运输代理、陆路国际货物运输代理等。股东信息显示,该公司由华统集团有限公司旗下浙江格远供应链服务有限公司、MIRARI CO.,LIMITED共同持股。 天眼查信息:https://www.tianyancha.co…

    2025年9月12日
  • 张雪峰被禁言账号1分钟视频报价40万

    #张雪峰被禁言账号30天内掉粉7.41万##公司回应张雪峰被禁播# 据报道,9月24日,张雪峰账号在微博、小红书、抖音和B站平台均被禁止关注。工作人员回应称,公司业务不会受影响,老板一个月内不直播,一个月后就会直播。 第三方数据显示,张雪峰老师视频平台近30日掉粉7.41万。商业化水平显示,其1-20s视频广告报价为30万、21-60s视频广告报价为35万,…

    2025年9月25日
  • 华为新专利可使自动驾驶车辆的避障策略更具备类人性

    #华为公布自动驾驶避障专利# 天眼查知识产权信息显示,10月25日,华为技术有限公司申请的“避障的方法、智能设备以及系统”专利公布。 摘要显示:该方法包括获取环境信息,该环境信息包括当前路段的道路信息、障碍物信息和障碍物信息对应的置信度;根据环境信息,确定避障约束条件,该避障约束条件包括车辆的横向避障幅度区间和车辆的横向加速度区间;在满足避障约束条件的前提下…

    2024年10月26日
  • 没钱消费可以分期啊!4000家银行血拼消费贷砸了网贷的锅

    Pura X发布之前,余承东可以说吊足了大家的胃口,什么全新形态、新物种、人人都能买得起,更是拉出来华为二公主拍摄广告片宣传。‍ 可当发布会上Pura X价格公布的那一刻,全场沉默了,说好的人人都能买得起,竟然是7499元起步,有网友表示,突然被某大厂开除人籍了! 自然,从发布会后到现在,余承东还在社交媒体上持续挨骂!余承东也很例外、罕见的公开回应质疑:「谢…

    2025年3月25日

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

邮件:939297903@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信