以人工智能通用大模型为基础的ChatGPT兼具大科学装置和重大生产力布局双重属性,被认为是继互联网之后科技革命的引擎,有望承担启动新一轮长波经济周期的重任。目前国内多个地区纷纷谋划中国版ChatGPT大模型,布局人工智能产业发展先手棋,建立数字经济时代的产业护城河,避免沦为其他地区的“打工者”
四川拥有绿电能源和算力供给两大基础优势,政务数据和重点产业数据归集已完成,为ChatGPT大模型建设夯实了基础。西部腹地人口众多、需求旺盛和辐射面广决定了四川具备充足稳定的应用场景。四川应抢抓通用人工智能发展的机遇窗口,主动谋划建设四川版ChatGPT大模型,对于构筑数字经济竞争壁垒、提升四川基础设施能级、吸附全球数字产业资源,具有十分重要的现实意义。
大模型已成为数字时代“竞争之核”
多地抢抓机遇纷纷展开布局

(一)ChatGPT大模型是新一轮经济增长周期前奏,广泛提升生产效率引发产业变革

近半美国企业使用ChatGPT,替代员工提升生产效率。ChatGPT是微软投资的创业机构OpenAI研发的自然语言处理工具,俗称聊天机器人,自202211月上线至今全球用户已超过1亿,是互联网有史以来增长最快的应用。这得益于它作为首个突破通用性临界点的人工智能,能够应用于多种语言、多种任务和多种应用场景。微软宣布将投入百亿美元将ChatGPT通用性能力植入云计算、搜索、办公软件等系列产品,以服务于海量消费者群体和企业客户。截至目前美国近50%的企业已在使用ChatGPT,其中48%已让其代替员工工作,生产效率大为提升[1]
ChatGPT大规模商用,将在需求侧拉动ICT产业发展。刺激芯片、电子、算力、电力等硬件技术进步,从而推动相关产业向更高水平发展,软件驱动硬件有望成为第一制造业。以谷歌为例,如谷歌搜索部署ChatGPT,需要51万台服务器和总共410万个GPU,总成本超过1000亿美元[2]。ChatGPT技术的普及和应用将出现新模式新业态,形成全新的产业链和商业生态,不仅改变人们获取信息的方式,更将对社会和经济产生深远影响。

(二)中美角力人工智能首席大国,大模型成为兵家必争之地

美国正在形成人工智能“Wintel联盟,限制中国人工智能产业发展。PC互联网时代,微软操作系统+英特尔芯片形成Wintel联盟,并在其基础上发展出丰富的应用生态系统,美国借此占据PC互联网时代制高点,攫取了产业链顶端价值。移动互联网时代,安卓与iOS操作系统+高通芯片又形成新的Wintel联盟,不过一度被华为鸿蒙操作系统+麒麟芯片打破,美国的移动互联网掌控权大不如PC互联网,中国赶超态势明显。人工智能时代,微软OpenAI的ChatGPT大模型+英伟达GPU芯片正在形成又一个Wintel联盟,ChatGPT不对中国开放,去年美国就限制英伟达高端GPU芯片A100出口中国,试图在人工智能时代再现PC互联网时代掌控力。
中国亟需发展人工智能大模型推动产业发展应对中美竞争,实现自立自强。加速人工智能应用大规模落地的大模型成为我国人工智能产业发展的重要突破口。大模型及其软硬件支撑系统的生态之争必将成为中美角力人工智能首席大国的焦点,中国亟需打造自己的ChatGPT推动人工智能产业进入新周期,带来更加广泛的产业变革引领经济发展。相比芯片,发展AI大模型算法不会受制于供应链限制,较少“卡脖子”技术,任正非坦言5G是小儿科,未来最大的产业是人工智能,人工智能将给社会提供更多的效率支持,竞争格局会因为人工智能发生翻天覆地的变化。
人工智能产业上一个周期趋于尾声,传统人工智能红利消失。自2012年人工智能视觉识别取得突破性进展获得实际应用以来,人工智能产业发展已超10年,以视觉识别为主的感知型人工智能产业进入平台期。截至202210月,我国人工智能上市公司中有30%出现业务亏损,45%出现营收下滑,最大市场安防行业趋于饱和,亟需更换发展路径。究其原因,针对特定应用场景点对点开发人工智能算法,这种手工作坊式生产模式难以为继。业界正在探索算法超市、AI大模型等路径,以提升人工智能的通用性进入工业化生产,降本增效应用于多个场景。

(三)打造中国版ChatGPT,各大地区抢跑开建大模型

国内多个地区瞄准机遇,在类ChatGPT领域着重发力,基于AI大模型先发优势,北京、上海都喊出要打造中国版ChatGPT。据雨前顾问统计,中国共有6地布局了AI大模型,主要分为3个梯队。
第一梯队:北京与上海。个城市的基础条件均包括“算力+大模型+头部企业”。北京有一个超算中心和两个智算中心,其超算中心支撑北京智源人工智能研究院训练AI大模型悟道2.0”。此外北京还有头部企业百度,其类ChatGPT“文心一言”大模型将在3月16日发布北京市经信局表态要支持头部企业打造中国版ChatGPT。上海已初步形成了“一平台、五中心”的算力中心发展格局,兼具超算智算能力,总承载能力超过10EFlops(每秒可进行一百亿亿次的浮点运算),拥有商汤的科技视觉类AI大模型,2月份复旦大学开发了MOSS大模型上线类ChatGPT应用。
第二梯队:深圳与杭州。这两个城市在“大模型+头部企业+科研(创业)团队”表现突出,但算力基础设施缺乏超算智算双中心的布局。深圳拥有华为、腾讯、百度等头部企业的盘古、混元、文心等AI大模型,以及鹏城实验室的鹏城神农、鹏城盘古等AI大模型,但在算力方面,深圳只有超算中心缺智算中心。杭州的阿里达摩院提供了300多个优质的开源AI模型,其中超过1/3为中文模型。类ChatGPT语言类大模型,包括阿里巴巴的文汇、创业团队元语智能的ChatYuan以及西湖大学的心辰ChatProtMD。语言、视觉、音频等多模态大模型,包括阿里巴巴的M6和通义M6-OFA,心识宇宙的MindOS。算力方面,杭州缺超算中心,智算中心一期算力40PFlops,不及成都的300PFlops
第三梯队:武汉和济南。这两个城市拥有“算力+大模型”布局。武汉有全国首个基于昇腾算力的人工智能计算中心与超算中心,中科院自动化所与华为合作的“紫东太初”多模态大模型,参数量达千亿级,此外还有武汉大学与华为合作的“武汉LuoJia”科学计算类大模型。济南是国内服务器头部企业浪潮信息的总部所在地,拥有超算智算双中心,是我国首台完全采用自主处理器研制的千万亿次超级计算机“神威·蓝光”的诞生地,基于浪潮信息的算力基础设施,济南布局了源1.0语言类大模型,参数量达到2457亿。
四川发展AI大模型的优势与挑战
各地布局AI大模型虽然具有一定的先发优势,但未突破通用性临界点,并无发展ChatGPT语言类大模型的绝对优势,当前打造中国版ChatGPT对各地而言都是机遇期。四川应避免“拿来主义”思想,充分发挥电力、算力等领先优势,聚焦数据特色优势,快速下定决心,迅速出手抢抓AI大模型建设“窗口期”

(一)发展语言类AI大模型打造中国版ChatGPT,各地竞争优势并不显著

近年AI大模型快速发展得益于算力、算法、数据三大要素共同进步,数据与算力是模型训练的基础,算法是模型实现路径,三大要素齐聚才拥有发展AI大模型的基础条件。从算力看,ChatGPT语言类大模型一旦大规模应用落地,将产生巨量算力成本,北京上海深圳等一线城市并无优势。从算法看,语言类大模型过去不受重视,头部企业技术优势并不显著,强如谷歌展示类ChatGPT应用都发生事故,反而有长期积累的创业团队更有优势,OpenAI本身也是创业企业,相比头部企业更有活力。从数据看,ChatGPT采用公开数据,而各大省市注入自身擅长的行业专用数据,可以打造独具特色的地方版ChatGPT展开差异性竞争。

(二)四川具备“电力+算力”成本优势,以及数据特色优势

一是电力成本优势。发展算力需要大量电力投入,2021年我国数据中心年耗电量2161亿千瓦时,占全国总用电量的2.6%,超过钢铁行业成为各产业中耗电第一大户,考虑到未来对算力需求仍将高速增长,算力对电力消耗所占比重将进一步上升。四川作为水电大省,具备电力成本优势。近两年平均富余电量约为180亿度,占全国近七成;年均工业电价0.49/[3],排名全国第10,比长三角、粤港澳大湾区等地价格低约30%综合水电的绿色低碳性、富余电力充足、工业电价优势等方面考量,四川在电力方面具备发展人工智能大模型的巨大优势。
二是算力成本优势。成都是全国第二个拥有超算智算双中心的城市,算力供给充沛且价格便宜。比如成都超算成本优势非常突出,超算的DCU性能只有英伟达V10060%-70%,但是基于电力资源优势,成本只有英伟达的1/6,不到阿里云和华为云的1/10。成都还发布全国首个算力产业专项政策,进一步压低算力成本,比如每年发放1000万元算力券供企业与个人使用成都超算智算算力,前3年给予人工智能大模型建设方每年最高500万元的算力成本补贴。
三是数据特色优势。成都公共数据资源底座建设逐步完善,以智慧蓉城建设为核心建立了全国领先的“城市大脑”系统,稳定、持续开展城市公共数据收集,到2022年,已汇聚政府、企业和社会75360亿条数据资源,在医疗、消费等方面具备全国领先的数据优势并结合商汤、云从等人工智能头部企业成都公司,以及考拉悠然、晓多科技等本土企业的应用算法能力,打造面向多个行业的算法产品。成都算力产业专项政策还授予人工智能大模型建设方“城市数据合伙人”,在政策允许范围内优先享受安全生产、信用服务、交通运输、医疗卫生、公共安全、社保就业等公共数据集支持。
总体来看,四川是AI大模型竞赛“全能选手”。上海、北京、深圳等地算法模型领先,但在电力、算力等方面存在不足;宁夏、云南等地具备电价优势,但在富余电量、算力基础设施与算法模型方面存在短板。四川在算力、数据、算法三个方面均有布局,较多地具备比较优势。

(三)资金投入过大、同质化竞争与核心算法不强是发展大模型三重挑战

一是投入过大挑战。人工智能大模型是“吞金兽”、耗电大户,需要大量数据、算力持续“喂养”,资本投入量达到千亿级。据估算,大型语言模型训练成本介于200万美元至1200万美元之间,ChatGPT训练一次的成本就高达1000万美元。目前ChatGPT每个月的运营对应GPU芯片需求超过3万片,每天电费就高达5万美元左右[2]
二是同质化竞争挑战。各地人工智能大模型项目存在同质化竞争风险。作为一种基于自然语言处理技术的智能聊天机器人,ChatGPT的语言类大模型具有很强的通用性,用户和应用的迁移成本较低,在具体应用中将呈现强者愈强的“马太效应”,后发者如无明显的技术优势将很难生存。
三是核心算法挑战。四川缺乏自然语言处理、计算机视觉、语言识别、知识图谱等算法通用技术领域龙头企业和核心团队,百度、阿里、浪潮、商汤、云从、科大讯飞等AI龙头企业虽落地成都,但核心算法部门和团队并未部署,存在核心算法供给不足的挑战。
总体来看,四川亟需弥补核心算法短板展开差异化竞争。四川应加强与国内外人工智能领域的合作和交流,引进优秀的算法团队和技术平台,提升自主研发能力和创新水平,根据四川的产业优势,定制化开发具有本土特色的大模型应用,打造差异化的竞争优势,获得更高的回报率以化解投入过大的风险。

四川发展人工智能大模型思路建议

抢抓ChatGPT大模型引发产业变革的关键窗口期,谁掌握通用大模型,就能塑造数字时代产业发展的竞争力和吸附力,进而重塑区域能级。四川应立足电力算力领先优势与数据特色优势,面向全国广泛需求,以错位发展、差异化发展的思路加快打造四川版ChatGPT。为此,雨前顾问聚焦引团队、供数据、强算力、育算法、促应用、保安全,提出6点措施建议。

(一)引团队,快速启动语言类通用大模型建设

瞄准头部企业语言类大模型项目团队、专注于NLP自然语言处理的创业团队和高校团队招引,抢跑各地快速启动语言类通用大模型建设,创造类ChatGPT应用的新场景,让它成为一个具有广泛应用价值的通用工具,服务于传统产业的数字化、智能化转型,同时有效消纳四川过剩的算力资源。

(二)供数据,发挥行业优势打造四川版ChatGPT

从省级层面统筹推进数据供给,与来川大模型开发团队共享四川在电子信息、装备制造、医药健康、食品饮料、先进材料、能源化工等支柱产业中积累的海量高质量数据。在语言类通用大模型基础之上,打造出具有地域特色和产业特点的四川版ChatGPT,比如全国最强的医疗版ChatGPT,并通过不断优化和迭代,提升其智能水平和服务能力,规避同质化竞争风险。

(三)强算力,推动川西水电专供大模型开发运营

加快建设川西水电特高压通道,为算力中心提供专网专线,保障能源供给和低成本电价支持,降低开发运营大模型的算力成本。强化省市联动,探索建设“算电协同”体制机制,进一步将四川绿电优势转化成都算力优势,吸附包括大模型在内的算力刚需产业聚集,以电力强化算力,以算力构建四川数字经济生态圈,促进创新链与产业链的融合。

(四)育算法,突破核心算法推动大模型持续进化

一是引进国内外领先的算法人才和技术资源。与国内外知名企业、高校和科研机构建立紧密合作关系,吸引优秀的算法人才和技术资源来川发展。二是走出去共建和使用大模型开源软件。鼓励本地企业和机构参与大模型开源开放软件体系的共建和使用,增强大模型的效果和泛化能力;三是协同攻关突破核心算法。支持企业、高校、科研院所、新型研发机构、开源社区等协同攻关,突破核心算法,推动大模型持续进化。

(五)促应用,先行先试国内外大模型探索创新

一是推动龙头企业、科研机构、平台公司与国内AI大模型提供商合作。这些企业与机构应积极接入百度、阿里、华为等国内知名企业提供的AI大模型服务,并与其在产品研发、标准制定等方面展开深度合作,探索其在各行各业的先行先试应用,打造首批落地场景和解决方案。二是支持创新创业企业利用国际AI大模型拓展海外市场。中小微创新创业企业应积极探索在海外设立分支机构或合作伙伴,并借助OpenAIGoogle、微软等国际巨头企业提供的AI大模型服务,提升自身生产力和竞争力。同时,应注重将其开发的产品或服务引入国内市场,并结合本土化需求进行优化和改进。

(六)保安全,建立监管框架促进大模型健康发展

探索建立适应性强、动态更新的人工智能监管框架。参考国际先进经验,制定符合国情和实际需求的人工智能技术监管规则和办法,明确各方责任主体和义务范围。创建“AI高风险应用场景”清单,在涉及公共利益、个人权益或社会稳定等方面的“高风险”应用领域,对AI大模型技术开发和使用实施严格的审查和监督机制。通过有效的人工智能监管框架,保证人工智能在安全底线上运行,促进其健康可持续发展。
[1] 美国《财富》杂志
[2] 国盛证券报告《ChatGPT需要多少算力》
[3] 年均工业电价=年均代理购电价格+110千伏输配电价,因各地差异不大,且金额较小,暂不纳入对比。
——END——

继续阅读
阅读原文