盘古开天: 自带算力的大模型
任正非
我们即将进入第四次工业革命时代,其规模之大不可想象
第一次工业革命:蒸汽机时代;
第二次工业革命:电气化时代;
第三次工业革命:信息化时代;
第四次工业革命,是AI带给人类的颠覆性革命。可人工智能伴随我们70多年,为什么今天才进入AI革命纪呢?
因为AI大模型的出现,特别是生成式AI得到验证后,通用性问题被解决:
人类和AI,将携手创造一个全新世界。
所以,谁拥有优秀的AI大模型,谁可能就是第四次工业革命的“奇点”,谁就是未来世界的“母体”。
这也是华为为什么一定要推出“盘古大模型”的原因,因为大模型决定你在AI世界的地位。
鸿蒙初辟,盘古开天。当然,AI大模型仅仅自己优秀还不够,还需要算力支撑。就像再好的内燃机,也需要石油,而算力就是AI大模型的石油。
所以,任正非又补充了一句:
基础就是大算力
孟晚舟也在华为全联接大会2023上说:
持续打造算力底座。
谁拥有最强算力,谁就可能赢得AI时代。
华为拥有鲲鹏和昇腾根技术,扎根原子世界打造算力底座,让来源于物理世界的算力不再卡AI数字世界的瓶颈。
现在看来,华为初步解决了AI的两大痛点
一是算力;二是大模型。算力是大模型的基石,而大模型是场景的基石。
但要在AI时代占据至高点,最大的困境其实是第三点:场景
第四次工业革命的战场在于大模型,
而大模型未来在于“场景”。
大模型背后的“痛点”:场景
ChatGPT出现之初,全世界为之惊艳。
一石激起千层浪,人类精英为AI的质变击节赞叹。
一时间之间,“AI大模型改变人类世界”、“AIGC带来新卢德运动”、“60%的精英将被AI替代”这样的言论冲击着世界的每一个角落。
是的,生成式AI确实正在改变世界。
但是这些让人拍案叫绝的产品,真的在商业上能形成闭环吗?你喜欢它,但是你会持续用它吗?你会为它付费吗?
想一想,作为一个普通用户,三个月前想方设法交钱的你,是不是很长时间没有给ChatGPT付费了?
《Analytics India Magazine》指出
 OpenAI 运行 AI 服务每天就要花掉70 万美元。尽管 Altman 一直努力推动 GPT转为收益,但 OpenAI 仍远未能达到收支平衡。
所以说,纵使强大如ChatGPT,也是如履薄冰。
百模大战真不是夸张,而且个个都是市场上顶尖的选手。
AI从业者都清楚,大模型最后的决战在tob垂直行业模型,核心点在于服务“场景”本身。
谁能将AI跟传统的互联网、数字化产业结合起来,谁有可能成为最后的王者。
盘古一气化三清:不做诗,只做事
华为云的盘古大模型,现在走的正是“场景”这一条路。
如果说
ChatGPT热衷“做诗”
,那
盘古大模型热爱“做事”

而且是
“解难题”“做难事”,
也就是要帮助行业落地场景实战。
创造AI“
应用场景
”,这就是华为云盘古大模型干的事。

大模型赛道“看热闹”的时期过去了,市场正在对大模型的实用提出要求。
C端市场的集体狂欢相比,开发者更关心大模型如何在B端行业落地。仅仅只会“Chat”(聊天)是不够的,还要满足各种应用场景“。
那盘古大模型是如何创造AI“应用场景”的呢?看看盘古大模型的“一气化三清”:
这是一个具有「5+N+X」三层架构,就是从 AI 能力的基础层,到行业的第二层,再到应用层面向场景的各个接口,也就是说,它的入口就是“场景”。
L0 层包括 NLP、视觉、多模态、预测、科学计算五个基础模型,提供满足行业场景中的多种技能需求。盘古 3.0 提供了 100 亿380 亿710 亿1000 亿参数等基础大模型,以匹配不同场景。
L1 层是多个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的 L0 和 L1 层上,为客户训练自有的专用大模型。
L2 层提供了更多细化场景的模型,更专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供「开箱即用」的模型服务。
开天易,创世难
宇宙大爆炸容易,3分钟之内完成。
但生命世界的形成和演化,并不容易。
经历了几百亿年,才有了地球上丰富多彩的生态。
人工智能创世,也要演绎万千世界。
每个场景,又完全不同。
盘古大模型分为更多行业方向,解决人类世界的难题:
矿山、药物分子、电力、气象、海浪、铁路、政务、金融、制造等垂直行业大模型。
这一个个的场景,最难解决。
举个例子,要想打造一辆超越人类老司机驾驶的顶级汽车的AI汽车行业大模型,有多难?
汽车漫长产业链每一个环节、零件都要根据智能自动驾驶重塑,根据需求重新打磨。硬件层面包含车辆硬件、视觉和雷达等多传感器选型、传感器布局安装等;
软件层面包含数据清洗、数据标注、感知算法、定位算法、决策规划和执行控制等;
每一个环节客户都要收集需求信息,覆盖设计、生产、营销、研发......
而这只是完成了第一步生态搭建。
假设AI汽车已经熟练通过通常路况,那特殊交通情况呢?雨天、雾天、前方突发事故、指示牌变形......所谓corner case;
这些特殊情况单独都是小概率,加在一起构成大概率事件,这就是长尾效应。
基于华为云汽车大模型的自动驾驶场景数据解决方案有这些优点:
1
数据质量更加鲁棒,支持位姿偏移自动修正,实现多旅程重建、并进一步仿真和生成新行驶轨迹数据;
2
重建精度高,开阔大场景精度厘米级,误差小于千分之三,从而实现大视角变换,支持不同车型适配和车道变换;
3
重建场景可按需编辑,支持通过环拍数据进行3D物体重建、并将重建的交通参与者添加到原场景中。
最终突破大场景高几何精度多相机融合前背景光照和谐化等技术难题,实现可控Corner case场景生成。
一个汽车领域,就要耗费盘古如此多的心力和算力。
开天易,创世难。
当然不仅仅只是汽车,盘古大模型的目标是要重塑千行万业。
汗流为雨泽:政务大模型
盘古政务大模型基于多模态大模型的能力,通过千亿级参数的NLP大模型对百万级别的政府政策、公文进行精调,让它了解城市的事项标准和政策法规。
通过与CV大模型进行多模态融合训练,除了实现对文本输入理解,还可以对城市视频、图像进行动态解析。
深圳市福田区政数局基于盘古大模型,上线了为市民提供政务服务的智慧助手小福。
对超过20万条政务数据进行精调,包括12345热线、政策文件、政务百科等,掌握了丰富的行政法规、办事流程等政务知识,解决了政务热线在问题拆解、多重意图理解、政务政策关联等方面的难题,让小福成为既有温度又极专业的政务服务助手。
现在盘古政务大模型又开始攻克城市治理的难题。城市治理是一项复杂的系统工程,需协同超过40个业务部门,应对4000多个开放场景并关联上万条政务法规条例。
例如,在台风等自然灾害过后,城市各种设施可能会受到损坏,如绿化树倒塌、道路积水等几百个场景,需协同十几个部门进行分拨处置,需耗时几天甚至更长时间。
点击展开
点击展开
因此,实现城市事件万物感知智能分拨是一项极具挑战性的任务。
盘古大模型对这些城市事件能做出准确理解,当工作人员确认处理后,盘古能够将这些开放事件按照优先级,准确分拨至园林绿化、环卫等部门处置,让城市事件秒级发现,分钟级分拨,让城市管理者拥有高效的政务智慧助手。
血液为江河:铁路大模型
在铁路领域,我国铁路营业里程15.5万公里,铁路货车超过100万辆,货车运行的安全性引起高度的重视,TFDS(Trouble of moving Freight car Detection System,货车运行故障动态图像检测系统)是被广泛应用的一个检测系统。
受制于技术发展,TFDS当前仍采用人工方式进行故障识别,尚未完全开展智能识别工作。人力劳动强度大,人力成本高。
例如,货运列车通常编组为60-100辆,每套TFDS有5个拍摄点位,每辆车/每节车厢拍摄约80张图片。以平均每列车50辆车厢计算,每列车的拍摄图片约为4000张,要求检测人员10分钟左右看完。其中故障/疑似故障图片约177张,实际有故障的约20-30张,包括掉漆,划痕等极小故障。
通过大模型技术,原来人工需要识别4000张图片,现在仅需要复检170多张图片,工人劳动强度下降95.75%,极大提升了检测效率,同时提升了故障识别率,提高了列车安全性
在实际应用中,能精准识别67种货车430+种各类故障,重大异常故障100%识别综合故障识别率达99.8%,超过客户预期。
筋脉为地理:矿山大模型
煤矿生产是一项复杂、危险性较高的工作,当前在300米井下仍需大量人员现场作业,因此通过AI来实现“少人无人”的安全高效作业是煤矿智能化追求的重要目标。
然而,AI在煤矿行业落地存在着场景需求多、矿山间复制难、场景落地难、AI人才不足等挑战。
华为云盘古矿山大模型只需导入海量无标注的矿山场景数据进行预训练,即可进行无监督自主学习,仅一个大模型就能覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让AI应用在煤矿普及更容易。
面向洗选场景,在视觉大模型的基础上,山东能源集团引入了盘古预测大模型,通过对不同煤层、不同季节、不同灰分的原煤煤质数据和工艺参数智能分析智能选择一系列专业小模型进行层次堆叠,基于自研的图网络融合技术对多个专业小模型高效融合、动态调优,精准预测精煤产品的灰分值,从而实现重介选煤分选密度的精准控制与实时调整
新的方案让煤矿能洗选出更多的精煤,山能济宁二号煤矿每年多产出
8000吨精煤
。这个能力推广到全国,可让每个煤矿每年平均多产出
2000吨精煤
,精煤产率提升
千分之二
,增收
2000万

发髭为星辰:气象大模型
华为云盘古大模型研发团队独立研究并撰写的一篇论文《Pangu-Weather: A 3D High-Resolution Model for Fast and Accurate Global Weather Forecast》登上了《自然》杂志。
作为工程领域的 AI 技术,登陆 Nature 正刊是一件罕见的事。
该论文详细介绍了基于深度学习开发的精准精确全球 AI 气象预报系统 —— 华为云盘古气象大模型。
这是首个精度超过传统数值预报方法的 AI 预测模型
,突破了 AI 预报天气精度不及传统数值预报的世界性难题,对比传统方法预测速度提升
10000 倍
,可秒级完成对全球气象的预测。


《自然》审稿人对该成果给予高度评价:
盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。
因为盘古气象系统的准确表现,欧洲气象局已经将该系统列入了模型对比作为参考。
盘古气象大模型今年在台风路径预测上具有精准的表现。
为了攻克暴雨预测的难题,这个夏天,华为云团队夜以继日地攻关。在40年全球气象数据的基础上,增加了10年卫星降水数据,并通过独有的3D EST-3地球空间网络训练优化,使得盘古气象大模型具备了新的降雨预测能力,目前已经实现对未来6小时24小时的短期和中期降水预报。
这是首个精度超过传统数值预报方法的 AI 预测模型
,突破了 AI 预报天气精度不及传统数值预报的世界性难题,对比传统方法预测速度提升
10000 倍
,可秒级完成对全球气象的预测。


《自然》审稿人对该成果给予高度评价:
盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。
因为盘古气象系统的准确表现,欧洲气象局已经将该系统列入了模型对比作为参考。
盘古气象大模型今年在台风路径预测上具有精准的表现。
为了攻克暴雨预测的难题,这个夏天,华为云团队夜以继日地攻关。在40年全球气象数据的基础上,增加了10年卫星降水数据,并通过独有的3D EST-3地球空间网络训练优化,使得盘古气象大模型具备了新的降雨预测能力,目前已经实现对未来6小时24小时的短期和中期降水预报。
这是首个精度超过传统数值预报方法的 AI 预测模型
,突破了 AI 预报天气精度不及传统数值预报的世界性难题,对比传统方法预测速度提升
10000 倍
,可秒级完成对全球气象的预测。


《自然》审稿人对该成果给予高度评价:
盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。
因为盘古气象系统的准确表现,欧洲气象局已经将该系统列入了模型对比作为参考。
盘古气象大模型今年在台风路径预测上具有精准的表现。
为了攻克暴雨预测的难题,这个夏天,华为云团队夜以继日地攻关。在40年全球气象数据的基础上,增加了10年卫星降水数据,并通过独有的3D EST-3地球空间网络训练优化,使得盘古气象
大模型具备了新的降雨预测能力,目前
已经实现对未来6小时24小时的短期
和中期降水预报。
经过系列测试,模型的降雨量预报精度提升了
20%
以上。

齿骨为金石:
药物分子大模型 & 医学大模型 
药物研发行业存在一个著名的“双十定律”,即新药研发需要花费10年时间10亿美元
而按照Nature的统计,“双十定律”其实是一种理想业态,现实中一款新药从研发到获批上市,平均需要10到15年的时间,需要耗费约26亿美元,而且临床成功率不到10%

西安交通大学第一附属医院刘冰教授在新药研发中采用了基于华为云盘古药物分子大模型打造的AI辅助药物设计服务,突破性地研发出一款对多种耐药菌都有明显效果的广谱抗菌药,并将先导化合物的研发周期从数年缩短至一个月,研发成本降低70%,打破了医药界“双十定律”

这款广谱抗菌药有望成为全球近40年来首个新靶点、新类别的抗生素,改变病人面对“超级耐药菌”感染时无药可用的局面。其靶点特质决定了细菌将难以对这款广谱抗菌药产生耐药性,对抗疟(即疟原虫)药物研发等多个领域有着重要的影响。
如今这款广谱抗菌药已完成一期临床验证。
除此之外,华为云还发布了医学大模型,学习了1600万学术期刊等海量高质量数据以及100多万结构化知识图谱,得以具备医学临床辅助能力,可以在医学检验临床辅助诊疗个人健康管理等场景,成为医生和患者有力的医学助手。
基于盘古大模型研发的润达医疗大模型 
· 良医小慧,在
10个科室
的检验报告诊断对照测试中,盘古医学助手辅助诊断的准确率已经接近临床医生的平均水平。

未来将走进4000家医院,辅助医生进行报告解读和诊断,加速医疗普惠
精髓为气息:数字人大模型
盘古数字人大模型,通过录制一段3-5分钟视频,盘古数字人大模型即可为直播主播高效生成逼真的数字人。
同时,通过文本或语音,精准驱动数字人准确、流利地介绍产品,口型匹配度>95%
基于大模型的语言泛化能力,母语训练一次,数字人便可说多国语言,实现全球直播能力;基于智能互动问答服务,可以自动捕捉弹幕,并和观众实时互动,带来更好的直播互动体验。
贵州黔东南地区,很多特色农产品(如刺梨、硒锌米等)以及蜡染、古法造纸等非遗文化和商品,因大山阻隔,少为外界知晓,而本地传统的销售方式也销量有限
贵州电商云公司联合华为云,通过华为云MetaStudio数字内容生产线的数字人直播方案。
基于盘古数字人大模型,
用AI打造专业的数字人主播助手
,辅助当地村民直播,助力贵州非遗商品、农特产走出大山,走向全球。

大脑为珠玉:软件研发大模型
最后当然还有 AI 自动编程能力,华为云盘古的代码生成工具名叫 CodeArts
今年7月华为云将CodeArts研发工具与盘古大模型相结合,该工具训练了760亿行精选代码、1300万篇技术文档,具备智能生成、智能问答、智能协同三大核心功能,可以实现一句对话让代码生成、一次点击即可自动注释和生成测试用例,一条指令即可智能部署,让每个软件开发者都有自己的编程助手。
9月21日,在华为全联接大会2023上,华为云全面升级了华为云CodeArts Snap智能开发助手,基于华为云盘古研发大模型,加强了代码检视和代码优化能力,并接入到CodeArts软件开发生产线的全流程23个开发工具中。
今年7月华为云将CodeArts研发工具与盘古大模型相结合,该工具训练了760亿行精选代码、1300万篇技术文档,具备智能生成、智能问答、智能协同三大核心功能,可以实现一句对话让代码生成、一次点击即可自动注释和生成测试用例,一条指令即可智能部署,让每个软件开发者都有自己的编程助手。
9月21日,在华为全联接大会2023上,华为云全面升级了华为云CodeArts Snap智能开发助手,基于华为云盘古研发大模型,加强了代码检视和代码优化能力,并接入到CodeArts软件开发生产线的全流程23个开发工具中。
在10个科室的检验报告诊断对照测试中,盘古学助手辅助诊断的准确率已经接近临床医生的平均水平。
它内建了盘古大模型智能开发助手 CodeArts Snap,目标是一句话生成代码,一个案件生成测试用例,依次点击自动注释。我们的目标是让它称为每个开发者的 AI 助手,」张平安表示。

它有三大核心能力:
智能生成代码,智能问答和智能协同。

在现场,华为展示了用 CodeArts Snap 开发一个未完成的应用。
首先,我们用对话方式提出需求,把需求复制到代码注释位置,就可以命令 Snap 直接完成目标任务的开发
我们可以让 Snap 解释代码的意义,生成测试用例,随后直接一句话就可以让它自动提交代码,进行流水线应用部署,AI 还自动生成了 Commit 提交信息。
今年7月华为云将CodeArts研发工具与盘古大模型相结合,该工具训练了760亿行精选代码、1300万篇技术文档,具备智能生成、智能问答、智能协同三大核心功能,可以实现一句对话让代码生成、一次点击即可自动注释和生成测试用例,一条指令即可智能部署,让每个软件开发者都有自己的编程助手。
9月21日,在华为全联接大会2023上,华为云全面升级了华为云CodeArts Snap智能开发助手,基于华为云盘古研发大模型,加强了代码检视和代码优化能力,并接入到CodeArts软件开发生产线的全流程23个开发工具中。
华为云CodeArts Snap可以让研发整体效能提升 30%以上,同时,也让代码更符合编程规范和代码可信。
盘古研发大模型接入到Astro低代码平台,帮助开发者实现一句对话轻松生成应用,全面重塑软件开发
今年7月华为云将CodeArts研发工具与盘古大模型相结合,该工具训练了760亿行精选代码、1300万篇技术文档,具备智能生成、智能问答、智能协同三大核心功能,可以实现一句对话让代码生成、一次点击即可自动注释和生成测试用例,一条指令即可智能部署,让每个软件开发者都有自己的编程助手。
9月21日,在华为全联接大会2023上,华为云全面升级了华为云CodeArts Snap智能开发助手,基于华为云盘古研发大模型,加强了代码检视和代码优化能力,并接入到CodeArts软件开发生产线的全流程23个开发工具中。
今年7月华为云将CodeArts研发工具与盘古大模型相结合,该工具训练了760亿行精选代码、1300万篇技术文档,具备智能生成、智能问答、智能协同三大核心功能,可以实现一句对话让代码生成、一次点击即可自动注释和生成测试用例,一条指令即可智能部署,让每个软件开发者都有自己的编程助手。
9月21日,在华为全联接大会2023上,华为云全面升级了华为云CodeArts Snap智能开发助手,基于华为云盘古研发大模型,加强了代码检视和代码优化能力,并接入到CodeArts软件开发生产线的全流程23个开发工
华为云CodeArts Snap可以让研发整体效能提升 30%以上,同时,也让代码更符合编程规范和代码可信。
盘古研发大模型接入到Astro低代码平台,帮助开发者实现一句对话轻松生成应用,全面重塑软件开发
华为 • 盘古 • 第四次工业革命
说到第四次工业革命时,为何谈大模型?
因为第四次工业革命源于通用大模型的崛起。
在AI时代,大模型就是“技术之根”。
革命是一个历史符号,大模型才是技术应用。
所以,中国要有自己的世界级大模型。
那怎么样成为世界级大模型呢?
直接与ChatGPT硬刚ToC市场好吗?
不一定,盘古走了另外一条ToB的路线,创造行业场景,让更多企业一起开创AI世纪。
………
回到本文开头,AI时代三大要素最为重要
Ⅰ.算力
Ⅱ.大模型
Ⅲ.应用场景
基础算力是原子时代积累下来的技术,代表过去。它是大模型之根
大模型则是各大公司正在竞争的技术,代表现在。它是场景应用之根
AI时代最后比拚的不是技术,而是生态代表未来。它是AI时代进化形态
第四次工业革命取决于大模型,但大模型不是参数有多大,而是对行业的垂直渗透率有多高。有价值的不是万亿参数,而是哪些行业做深又扩展到更多行业。
除了盘古大模型,仍然要再强调一次算力。
华为一直在打造中国算力底座,早就全方位布局AI
所以孟晚舟才有底气称为世界构建第二选择,做厚AI“黑土地”
如果算力是AI的黑土地,那么盘古大模型是这“黑土地”的生命之树,也是AI技术的“应用之根”。
古有盘古开天地,万物新生;
今有盘古创世界,助力AI时代。
继续阅读
阅读原文