赛格特约作者  余绍清
史前智人经历的最大一次低谷,很可能发生在7万年前的某个时期。彼时,智人行将走出非洲,人口数量一度下滑到了数百人。但在穿越红海抵达亚洲大陆后,我们的祖先进入了完全不同于热带非洲的广阔天地,少数几位女性的后代们,用了6万年时间,覆盖了蓝色星球的绝大部分区域。
在最低谷的时期,成功熬下去,便可以登上后续的高峰。与其说这是人类社会数万年来的内置定律,不如说是根植于智人群体的一种心理暗示。在往后的人类发展历程中,伟大事业的开创者,无一不是成功熬过低谷期的长期主义者。
今天,自18世纪以降陆续出现的交通与通信革命,使得人类社会的演进速率在持续提升,如果我们把人类社会的运行看成一条曲线,那么就是说波峰与波谷之间的距离变得越来越近。
但可以确定的是,从2008年至今,再加上未来的5年、10年甚至更久,因为技术停滞不前而带来的全球经济萎靡、政治分裂、家庭收入减少乃至社会个体的普遍失落与集体疯狂,将成为定局。没错,当下处在低谷期的不仅有国家,还有城市、企业、家庭和个体,所有人都在“熬”。
但纵观各方,国家层面,不管大小,都在泛化“安全”概念,城市、家庭和大多数中小企业,都在收缩自己的资产负债表,个体则倾向于选择躺平、低欲望,只有大型科技企业持有激进的高风险偏好。客观上,科技巨头们承担着破局的社会期待,而这,也是去年OpenAI发布ChatGPT之后,能带来如此大规模冲击的原因所在。
身处大变局前夜,AI大模型激活了全球各地的科技巨头,除了中美,还有印度、欧洲和以色列,都有机构在集中发力。在中国,从3月份百度抢先发布“文心一言”,到9月7日腾讯亮相“混元”大模型,至此所有重量级玩家已全部入局。马化腾说,这是数百年一遇的像发明电一样的工业革命机遇,恰好表达了业内人士的心声。
所有人都在等待大变局的到来,所有人都不清楚变革的精确时间,但几乎所有人都认为,AI大模型是推动我们走出本轮低谷的关键角色。
AI大模型为何被视为救命稻草
假如把1946年“埃尼阿克(ENIAC)”的出现作为AI革命的起点,在过去四分之三的世纪里,AI已经经历了多轮起伏。
最近一次失望发生在“阿尔法狗(AlphaGo)”发布之后,人们发现击败人类围棋高手的AI,并没有如期带来生产生活上的冲击波。而在上世纪80年代,研究经济增长的经济学家罗伯特·索洛(Robert Solow)发现,在个人电脑和互联网开始勃兴之际,虽然企业加大了IT方面的投入,但投资回报率(ROI)却并没有明显得到增加。
一位名叫查斯曼(Strassman)的分析师,通过调查了292个企业印证了上述判断,很多企业上了很多IT系统,但似乎并没有什么用。为此,学术界将这种现象称为“生产率悖论”(productivity paradox),也称“索洛悖论”。
类似的疑问在过去十多年里的中国同样存在:没有切实的证据表明,近年来的产业数字化有效提升了全要素生产率。例如,从下图可看到,尽管2011年以来AI在制造业中的应用持续增加,但制造业的增速和全要素生产率却表现出波动下降的态势。尤其是2013年以后,AI的使用迅猛增长,但是制造业全要素生产率却从2011年的1.11下降到2020年的0.99。
不过,AI大模型的出现极可能将打破“索洛悖论”,这正是中美涌现“百模大战”的真正原因。
对企业经营者而言,大模型第一次提供了便捷可用的“降本增效”产品,对金融公司来说,大模型提供的数据分析水平赶上了大学毕业2年的员工,时间和金钱成本比都可能是1比100;对于教育界来说,AI大模型可以进一步更精准地判别需求,定制化地提供服务,帮助用户提高学习的效率,预计全球AI教育市场很快达到60亿美元,并在获得市场认可后迅速扩张成千亿美元市场。
服务业如此,制造业亦然。制造业领域过去推行数字化,用一个不恰当的比喻,有点像“马拉火车”,部分环节的数字化非但不能提升生产率,反而加重企业负担,导致发展质量下滑。但AI大模型出现后,随着训练水平的持续提升,大到生产、销售,小到会议纪要、运营策划,所有环节都可以被数字化,并且交由大模型进行计算。高盛的一份报告就认为,在AI大模型发展的十年内,预计每年可以将生产力提高超1.5%。
数据是石油,很早就有人喊出这句话。但要数据真正变成石油,必须首先依赖全域各环节的数字化才可能实现,其次也是更重要的,只有通过从海量数据中深度挖掘信息并将其转化为知识资本,才能够有效实现生产要素的功能倍增,由此带来制造业全要素生产率的提升。
AI大模型之所以被赋予厚望,甚至被视为走出当下经济与社会低谷的救命稻草,正是因为她已经初步展现了把数据变成石油的能力。
从应用到应用:本轮AI跃进的内核
从二战末期“原子弹”的爆炸,到科学家范内瓦·布什的报告《科学:无尽的前沿》被时任美国总统杜鲁门所接受,基础科研及纯理论科学家的地位获得快速提升。在中国,从事“两弹一星”的科学家名字也被广为传颂,院士、研究员、教授等高校科研院所的科学家们,也比企业研发人员获得更为普遍的尊重。
但在全球AI大模型的竞赛里,高校和科研院所却相对边缘,真正的主角全部集中在科技企业。之所以会出现这样的格局,是因为AI大模型能否获得持续突破,并不是一个或多个理论问题,而在于能否快速形成“从应用到应用”的技术-商业正循环。
之所以会打破“基础科研-技术创新-商业转化”这样的路径,原因就在于AI大模型突破了原有的强弱人工智能边界,过去人类智能时代所遵循的路径,在人工智能面前必须做出改变。当然,更重要的是,无论是训练大模型资金的持续投入,还是大模型对语料的高要求,都迫使整个AI大模型的发展向着落地应用走。
例如,在GPT-3阶段,一次训练费用就需要至少140万美元,仅仅在今年1月,大模型每天的电费就要5万美元;在国内,千亿参数级别的大模型对GPU的需求至少在10亿美元以上。除了科技巨头,高校、科研院所几乎不可能有能力进行这么高昂的投入,更何况是持续投入。
对科技巨头来说,这样的投入也是不可持续的,所以企业必须尽快找到应用场景,找到愿意埋单的消费者——无论B端还是C端。
所以,为什么腾讯早在6月便率先发布行业大模型,其目的就在于通过展示自身在众多行业的应用成果,来找到更多的消费者。9月7日的数字生态大会上,腾讯的一众高管也同样强调“腾讯各个产品都接入了混元大模型”这一核心信息,其目的在于突出自身应用场景丰富的比较优势。
不仅仅是腾讯,Meta推出Llama 2开源模型后就与各家云厂商打通,为的就是尽快获得更多更丰富的应用场景。对应用场景的急切追求,并不代表对大模型训练优化的忽视,相反,这本身就是一体两面的存在。只有扩大应用场景,才能更好地优化大模型,在应用中提升服务水准。
客观上,AI大模型将冲击越来越多的科研工作者,近年来城池尽失的“分子生物学”只是一个信号,未来会有越来越多的学科将受到AI大模型的挑战。这背后,不仅仅是科学家何去何从的挑战,更是科研范式如何变革的问题。当然,这是另一个问题,不作延伸。
坚定的长期主义者,才可能穿越周期
从社会情绪上来看,悲观是当前全球的主色调。局部战争与地缘冲突还在持续,通胀高企与贫富两极化看不到被遏制的迹象,就连AI大模型获得突破本身,也很快引发了伦理层面的争议,不安全感笼罩在众人的头顶。
在中国,泛安全的隐忧同样弥漫在社会的各个角落。在承受了多年制裁高压后,公众以“轻舟已过万重山”的诗句进行提前式的自我安慰,同时以“遥遥领先”这样略带调侃的戏谑,试图呼出积压在体内的一口闷气。
但在北纬三四十度的土地上,凌晨三点只能看到星斗若干,距离东方鱼肚白还需要忍受一阵接着一阵的孤寂与寒意。
对于微观意义上的家庭与个人,也许可以在经纬大地上辗转腾挪,选择别处的自由与光明;但对于宏观意义上的民族-国家、科技巨头,必须选择直面黑夜,穿越低谷,以迎接黎明,抵达高峰。
某种程度上,AI大模型的角逐就像人类社会演化的隐喻,只有坚定的长期主义者,才能穿越技术-经济的发展周期。在穿越时,不到最后,没有人知道谁是真正的长期主义者。因为真正的长期主义者,仅仅凭借足够的理性是不够的,还需要一点信仰,一点被迫和一点运气。
(原文首发于财新网,部分内容有改动)
往期回顾
继续阅读
阅读原文