行业大模型的突围之战

大模型的创新,不仅仅需要单点的创新,更要围绕AI-Native开展系统性地创新,不仅要在场景上广泛探索,更要在技术上形成突围。

大模型的创新,不仅仅需要单点的创新,更要围绕AI-Native开展系统性地创新;不仅要在场景上广泛探索,更要在技术上形成突围。

重塑一切的理想主义AI

大模型已成为当下IT产业无可争议的最大风口。

人工智能从概念提出至今已有半个多世纪,继“深蓝”和AlphaGo昙花一现之后,Transformer架构及ChatGPT的横空出世,再一次点燃全世界的热情,人工智能以更具象、接地气的方式呈现,大模型和生成式AI也开始走入更多人的视野。

过去的一年来,从互动问答、语音对话到文生视频,OpenAI屡次刷新热度;Google、Meta入局推出开源大模型,图谋一席之地;微软将GPT4.0集成到办公软件中,成为生产力工具;华为和苹果将手机语音助手接入大模型,加速端侧智能化。

AI产业的拐点已经来到,大模型正在重塑一切办公、生产和生活。

大模型火热的背后,英伟达成为最大的受益方。随着业界对AI算力的需求快速增长,GPU卡洛阳纸贵、一卡难求,其24/25Q1季报同比增长近4倍,达到260亿美金。受持续提升的业绩数据和不断放大的市场需求支撑,2024年6月18日英伟达市值达到3.35万亿美金,连续超越微软、苹果,成为全球市值最大的公司。

一切都在向着人们期待的方向发展,甚至有人喊出了“第四次工业革命已来”。

行业大模型的突围之战

盛名之下,其实难副

这波大模型浪潮并不如表面呈现的那样光鲜亮丽,几家欢喜几家愁。

根据红杉资本发布的报告,英伟达仅在2023年的芯片订单就高达500亿美元,赚得盆满钵满,而整个生成式AI企业的销售收入才30亿美元,多数企业距离盈利依然遥遥无期,甚至一些企业已经濒临破产的边缘。

如果淘金者持续淘不到金子,卖铲子的生意也终将不可持续。

不管是OpenAI、微软还是谷歌,这些AI的先行者都还没有找到稳定且持续的商业模式,更多的是为资本描绘了一副宏大的蓝图,以支撑市场的预期。

在国内,10亿参数规模以上大模型数量已远超100个。但还未形成成熟商业模式的大模型产业,已经开始卷起了价格,模型免费、Token降价、算力打折,多么熟悉的味道。在群雄混战的早期通过低价圈定一波用户和开发者无可厚非,适当的竞争有利于产业的良性发展,但无序的竞争将导致恶性循环,让大模型产业陷入死亡螺旋。

行业大模型的突围之战

2023年底,Gartner发布AI新兴技术成熟度曲线,大模型和生成式AI正处在技术炒作周期的最高点,Gartner对生成式AI做出了极高的评价,认为它将AI的热度推向了一个新高潮,但也表达了对繁荣之下所掩盖的潜在风险的担忧。

市场最终要回归理性,只有真正为用户创造价值才能实现商业闭环、有更长远未来。

理想很丰满,现实很骨感!大模型从趋势到全面落地依然任重道远。

化整为零,围绕行业穿插作战,实现战略突围

在这一波AI浪潮中,中国发展得怎么样?当网络上ChatGPT、Sora、英伟达的新闻铺天盖地袭来时,很多人不免产生焦虑:我们又落后了?

必须承认,我国在算力、算法和数据领域其实并不具备优势:高端算力卡被英伟达卡脖子无法供应,短时间内自有制程和设计又无法跟上;算法领域,虽然模型数量众多,但大多数是基于国外开源架构优化,缺乏自主性和领先性;数据领域,我们的开放数据和国外不在一个数量级上,中文语料严重不足。

AI的三要素,每一条都是致命伤!

但从另一个角度看,我国有全球唯一的全工业门类、最多的金融消费人群以及最大规模的政务和城市体系,产生了丰富的场景和私有数据,这些都成为发展行业大模型的天然土壤。于是,我们没有走大兵团正面突击的道路,而是化整为零围绕行业穿插作战,通过大模型赋能一个个行业细分场景,最终形成战略突围。

行业大模型的突围之战

近两年,在用户和厂商的共同努力下,一些行业大模型已经开花结果。大模型已经逐步应用政务导办、公文检索、事件分拨等场景,帮助政府提升政务服务效率和城市管理效率;在矿山领域,大模型和云边协同帮助矿山实现增安提效,加速产业集群智能化;在铁路,基于视觉大模型的TFDS火车故障轨边图像检测系统,实现不停车的实时图像采集和分析,自动识别各种不同类型的铁路货车故障;基于大模型的气象预测方案,计算速度相比传统HPC的数值计算提升一万倍,更精准预测台风路径。

还有医药、制造、钢铁、金融等更多行业的场景在持续落地,我们正在走一条和国外不一样的务实之路,不跟风不冒进,沿着清晰的目标和节奏逐个打磨场景,这种涓涓细流,终将汇聚成智能化的汪洋大海。

行业大模型加速落地建议

行业大模型建设,知易行难。

政企业务场景复杂多样,很难用通用大模型去应对。此时我们应该意识到,卷参数量、卷Token数、卷集群规模、卷价格都毫无意义,行业大模型落地更需要关注工程化的问题。

一、软硬协同发展

除了模型本身外,大模型还涉及开发平台、开发框架、计算架构以及各类工具,以及多样性算力、高性能存储和高带宽网络等硬件基础设施。在分层解耦架构的基础上,需要从性能、可靠性、可维护性以及兼容性等方面,进行端到端的集成设计和验证。比如软硬件全链路可视化运维、算网协同的低时延大带宽网络、基于亲和性的算子加速等,确保系统不仅跑得好,更要跑得稳。

二、采用AI-Native的云基础设施

AI-Native的云基础设施正成为越来越多企业的优先选择。基于公有云训练基础大模型,在本地私有云中结合私有数据通过二次训练和微调,这种混合云方案兼顾效率与安全,已成为大模型建设的新范式,同时云边协同的架构还可以有效简化海量边缘的管理,应对工业场景海量边缘接入的需求。它相比非云的部署模式,还能提供对通用算力和AI算力的统一调度,并基于其丰富技术栈覆盖数据、模型和应用开发全流程,降低开发门槛。

三、建立AI开发工作流,促进模型确定性交付

大模型是一个系统工程,其交付过程涉及数据管理、模型开发环境、模型训练、推理部署的全流程数十个环节,传统的开发机制很难解决跨团队协作和迭代开发的难题。要降低模型开发过程的不确定性,需要建立一站式AI开发工作流,帮助企业快速构建跨团队协同开发、高效迭代的机制,同时通过标准化、自动化的流程提高模型的交付效率与交付质量。

四、重视数据工程,打造优质数据集

模型性能是由数据质量和算法设计共同决定的,当前AI训练数据缺乏系统化的治理工具,甚至部分工作需要人为处理,存在集成、清洗和标注效率低,以及价值观的问题。打造高质量的AI大模型,必须构筑核心的数据工程能力,为大模型高质量供数。一方面可以借助开放的数据授权运营平台,获取高质量的数据;另一方面,针对内部数据需要引入自动化和智能化的手段,构建数据清洗、标注和质量评估体系;同时通过数据质量分析、成分分析、场景配比和智能配比能力,建立数据配比到模型效果的反馈优化机制,基于应用效果反馈持续调优,实现价值观对齐。

五、建立赋能机制,繁荣产业生态

生态是发展大模型不可或缺的一环。需要从技术生态、数据生态、模型生态和应用生态四个层面,去构建AI时代开放、可闭环、有质量的生态体系。这个过程中,政府和行业头部企业的作用不可忽视,可以带头建立如联创实验室、模型和应用商城、需求对接会、创新大赛等,并通过资金赞助、人才培养、政策扶持等多方面的牵引,通过行政手段打造中立的区域性赋能平台;行业头部企业在开展自身业务创新的同时,也可以通过技术、数据、模型和应用赋能行业和产业链上下游,从单企智能化走向行业智能化。

六、开展持续运营

大模型落地面临缺经验、缺人才、缺能力的挑战,大多数企业都是边实践、边总结。需要将这些经验和能力固化下来,逐步形成覆盖了大模型落地的全流程的工程能力,包括前期的顶层设计、POC测试、规划实施,中期构建优质数据集、开展场景分析和模型开发,以及后期的运维运营等。大模型运营和建设同样重要,缺少运营机制,大模型平台很难持续发挥价值。因此,需要打造适合企业的流程、组织和人才队伍,持续开展技术、生态、用户运营,不会断优化老场景、发掘新场景,最终实现全面智能化。

欲木之长者,必固其根本

大模型创新,归根结底是技术之争,根深才能叶茂。

大模型的创新,不仅仅需要单点的创新,更要围绕AI-Native开展系统性地创新,不仅要在场景上广泛探索,更要在技术上形成突围。

近年来,国内涌现了一批代表性的科技企业,如寒武纪、地平线、壁仞科技、讯飞、摩尔线程、华为、阿里、百度等,他们坚持投入人工智能创新,推动AI产业升级。

2023年,百度 “文心一言”、阿里 “通义千问”和讯飞 “星火”陆续推出,华为也发布盘古大模型3.0,提出“AI for industries”的理念,并基于华为云Stack推出了业界首个大模型混合云。近期HDC2024上,华为云盘古大模型5.0升级亮相,打造全系列、多模态和强思维能力,进一步诠释“解难题、做难事”的愿景,同时发布大模型混合云十大创新技术,通过AI-Native的系统性创新,加速企业专属大模型落地。

行业大模型的突围之战

创新者往往孤独,但注定不凡。

不仅需要沉下心,更要有“板凳要坐十年冷”的战略耐性。

我们终将迎来AI的黄金时代。

本文来自投稿,不代表创造权威IP 赋能创业者——IP百创立场,如若转载,请注明出处:创造权威IP 赋能创业者——IP百创

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2024年6月24日
下一篇 2024年6月25日

相关推荐

  • 拼多多、淘宝、京东:拼低价、卷服务、强技术

    配图来自Canva可画 近年来,随着技术的进步和消费者习惯的改变,电商行业的竞争环境愈发多元和动态。为了保持市场竞争力,各大电商平台就需要不断对竞争策略进行创新和调整。于是,在电商市场已经成熟的背景下,各大电商平台便开始通过专注于特定的细分市场来获得竞争优势。 现如今,电商市场的竞争正在迅速演变,开始主要集中在定价策略、客户体验、技术创新等几个关键方面。因此…

    2024年2月21日
  • 浙石化在舟山成立新材料公司注册资本5000万

    天眼查App显示,近日,浙石化新材料(舟山)有限公司成立,法定代表人为刘明辉,注册资本5000万人民币,经营范围包括基础化学原料制造、新型催化材料及助剂销售、新材料技术研发、新材料技术推广服务等。股东信息显示,该公司由浙江石油化工有限公司全资持股。 天眼查信息:https://www.tianyancha.com/company/7802976960

    2025年10月21日
  • 花样年集团等被强制执行5.2亿

    天眼查法律诉讼信息显示,8月6日,花样年集团(中国)有限公司新增3条被执行人信息,执行标的合计5.2亿余元,涉及建设工程施工合同纠纷部分等案件,部分案件被执行人还包括深圳市花好园房地产经营服务有限公司、成都市花样年房地产开发有限公司等,执行法院为深圳市福田区人民法院、崇州市人民法院。 风险信息显示,花样年集团(中国)有限公司现存50余条被执行人信息,被执行总…

    行业动态 2024年8月7日
  • 佳兆业等被强制执行4.9亿

    #佳兆业累计被执行超305亿# 天眼查法律诉讼信息显示,近日,佳兆业集团(深圳)有限公司、深圳市正昌泰投资咨询有限公司、广州市兆昌房地产开发有限公司、佳兆业地产(清远)有限公司等新增一条被执行人信息,执行标的4.95亿余元,涉及借款合同纠纷案件,执行法院为广东省深圳市中级人民法院。 风险信息显示,佳兆业集团(深圳)有限公司现存140余条被执行人信息,被执行总…

    行业动态 2024年6月25日
  • 北京东物流,南顺丰速运

    配图来自Canva可画 众所周知,“双11”是一年一度的物流高峰期,但2022年“双11”当日快递业务量并未达到预期水平,全年增速创下新低。据了解,“双11”当日业务量为5.52亿件,同比下滑了20.69%,而11月1日至11日全国快递业务量共完成42.72亿件,也同比下降了10.6%。 由此可见,虽然目前国内快递物流市场“天下已分、格局已定”,但以价格战为…

    2022年11月24日

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

邮件:939297903@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信