倒在黎明前?日本AI的世纪探索
来源:经济观察报
作者:陈永伟
事实上,日本在AI的发展史上很长时间内都是一股举足轻重的力量。早在二十世纪六七十年代,日本就已经开始了对人工智能的探索,并取得了一系列令人瞩目的成绩。到二十世纪八九十年代,日本不仅在AI的应用上实现了很多的突破,还提出了雄心勃勃的“第五代计算机”计划。更重要的是,当时几乎整个AI学界都将深度学习视为异端,而日本保留着大量这个领域的人才,几乎成了深度学习的最后堡垒。很多人都认为日本将会引领之后的深度学习革命。
然而,在进入新世纪之后,日本在AI领域的地位却日渐下降。在深度学习革命在全球范围内风起云涌之时,这个曾经的深度学习堡垒却异常安静。直到今天,日本在新一轮的AI革命中,似乎还没找到自己的位置。
那么,曾经在AI领域领先的日本为何会失去过去的三十年?在这背后究竟有哪些值得我们借鉴的教训?在未来,日本的AI行业还有翻身的希望吗?
什么叫“专家系统”呢?通俗地说,它是一种模拟人类专家解决领域问题的计算机程序系统。这种系统有大量领域专家水平的知识与经验,并能够根据系统中的知识与经验进行推理和判断,模拟人类专家的决策过程,从而解决那些复杂的问题。当一个专家系统包含的知识库越大时,它可以解决的问题就越多,能力也就越强大。而为专家系统准备知识的过程就被称为“知识工程”。
与“深度学习”(Deep Learning)相比,“专家系统”在知识获取上有很大的不同。“专家系统”的知识需要人来输入,因而“知识工程”的主体是人,而“深度学习”则是由计算机通过神经网络来自行学习,因而它更多是机器自己在学习。虽然从直观上看,让人来输入知识显然不如让机器自己学习来得方便,但在当时的技术条件下,人们还没有找到调节神经网络参数的良方,算力上也不充足,因而“深度学习”几乎无人问津,而“专家系统”则独领风骚。
很快,“专家系统”对AI领域的全面统治也蔓延到了日本。但与美国不同的是,这个过程在日本是以一种政府主导的方式完成的。
从二十世纪七十年代开始,经济实力迅速膨胀的日本就尝试运用国家主导的方式对一些关键的技术领域进行攻关,从而一举抢占全球技术的制高点。起初,日本用这种方式取得了一系列的成功,其中最经典的案例就是在动态随机存取存储器(DRAM)的研发过程中实现了巨大突破,从而让日本成了当时世界上最为领先的芯片大国。在实现了这些胜利后,日本政府立即将目光瞄向了当时炙手可热的计算机行业,试图抢在美国和欧洲之前开发出“第五代计算机”。
所谓第五代计算机,来自当时流行的对计算机发展阶段的一种划分方法。最初,这种方法的阶段划分依据主要是计算机采用的电路工艺。按此标准,第一代计算机使用的主要是电子管,第二代计算机使用的是晶体管,第三代计算机使用的是集成电路,第四代计算机使用的则是超大规模集成电路。
日本通产省于1978年委托时任东京大学计算机中心主任的元冈达(Tohru Moto-Oka)对第五代计算机进行探索。1981年,元冈达向通产省提交了一份长达89页的报告。报告认为:第五代计算机可能并不是被硬件工艺的突破定义,而是被体系架构和软件的创新定义。通过软硬件的结合,第五代计算机应该能像人一样与用户进行交互。在当时的技术条件下,这种未来的新型计算机应该是一个搭载着巨大的知识库的硬件化专家系统。
如今看来,元冈达的观点实在是过于超前了——事实上,他对于第五代计算机的展望就是现在各大巨头们正在竞相尝试的AIPC(人工智能电脑)。但在那个日本自信心爆棚的年代,它立即得到了通产省的认可。通产省很快就决定牵头启动第五代计算机的开发工作。
不过,在这一切开始前,还需要解决一个棘手的问题,即第五代计算机应该采用什么架构。在元冈达的报告中,他提出了六种先进的架构:逻辑程序机、函数机、关系代数机、抽象数据类型机、数据流机,以及基于冯诺依曼机的创新机。对于这六种架构,学界和业界都已经有了一些探索。其中,函数机的探索是相对来说最成熟的。比如,初创公司Symbolics已经在函数机上取得了不小的成就,它的软件性能已经可以比一般机器高出两三倍。因此,当时日本的不少专家也倾向于基于函数式编程语言LISP的函数机入手进行突破。然而,以渊一博(Kazuhiro Fuchi)为代表的一些专家则力主攻关基于逻辑程序语言Prolog的逻辑程序机。关于渊一博为什么会坚持这一观点,有一些解读认为,渊一博这么做其实是出于一个不足为外人道的原因:LISP是美国人提出的,而Prolog不是。因此,日本人为了实现“日本第一”的梦想,就不能沿着美国人的老路走。虽然这种观点听起来非常不理性,但联想到时代背景,这又似乎是最合理的一种解释。
最终,在渊一博等人的力主之下,基于Prolog的逻辑语言机被确立为了日本认定的第五代计算机的方向。随后,日本通产省联合几大公司,一起成立了第五代计算机研究所(Instituteof New Generation Computer Technology),并任命渊一博为该所的所长,统一协调研发事宜。渊一博从当时的各大公司和研究机构抽调了40位精干技术人员,号称“四十浪人”来进行具体研发。为了对项目提供有力支持,通产省计划在十年内投入四亿五千万美元的资金,同时由参与项目的公司也提供对应资金进行配套。
为了开发第五代计算机,日本几乎是动用了举国之力。在这一政策的影响之下,这个时代的日本AI界也自觉地团结到了为这一目标服务的队伍中来。很自然地,专家系统成了日本AI界当仁不让的技术路径。那么,日本的这场豪赌成功了吗?答案是否定的。
尽管在日本政府的热捧之下,第五代计算机的概念看似很热,相关的研讨会不断,论文层出不穷,但真正的技术研发却举步维艰。这一点很大程度上是由专家系统的特性决定的。如前所述,专家系统要足够强大,就必须进行庞大的知识工程。而为了保证输入了这些知识的计算机可以和人实现自然交互,还需要对交互的规则进行明确的设定。至少在那个时代,这是非常困难的。在现实中,一个词、一句话可能有各种不同的意思,机器应该采取哪种意思,要视情境而定。对于逻辑语言来说,每一个情景的规定,就是一个逻辑前提。因此,要用这种语言来实现自然语言,其需要加入的逻辑规则将是海量的,而再要机器根据相关的知识输出用户需要的内容,则更是难上加难,技术上根本无法实现。与此同时,日本经济高歌猛进的势头也急转直下,日本政府也不再有充足的实力来支持项目。最终,在提出了一些并不成功的样机之后,日本的第五代计算机项目以失败告终。
第五代计算机项目的失败对于日本AI界来说是巨大的打击。它不仅让巨额的研发经费付诸东流,更是把整个AI界都带偏了方向。本来,日本在神经网络和深度学习方面有很强的底蕴,但在全面为第五代计算机服务的背景下,全社会的资源都在向专家系统这一路径倾斜,甚至连福岛邦彦这样的大佬都很难申请到需要的经费。日本在神经网络上的优势开始逐渐消退。
2006年,命运的齿轮发生了转动。那一年,辛顿和其学生西蒙·奥辛德罗(Simon Osindero)发表了一篇重要的论文《一种深度置信网络的快速学习算法》(A Fast Learning Algorithm for Deep Belief Nets),建议利用GPU(图形处理器)来提升训练神经网络的速度。这篇论文的发表,让很多人认识到用GPU来突破算力瓶颈的可能性,因而神经网络研究在沉寂多年后,终于重新迎来了生机。为了让人们摆脱对这个学科的成见,辛顿还专门为这类研究重新起了一个名字,“深度学习”的大名就由此而来。
到2012年,深度学习终于向全世界展示了自己的力量。那年,一个名叫Alex Net的神经网络模型以 15.3%的低错误率赢得了Image Net大规模视觉识别挑战赛。这个成绩,足足比之前的错误率纪录降低了一半。这让整个AI界认识到,随着算力瓶颈的突破,或许深度学习才是未来AI的发展方向。于是,大批的资本、人才都开始涌入这个领域,而这个领域也迎来了爆发性的增长。2016年,基于深度学习的AlphaGo模型就击败了人类顶尖的围棋选手。2017年,Transformer架构又横空出世,基于这一架构,人们开始了生成式AI模型的研发。而几年之后,ChatGPT(OpenAI聊天机器人)又进一步引领了生成式AI革命。毫不夸张地说,在过去的十几年中,深度学习简直是在带领整个AI界一路狂奔。
在这段时间内,日本发生了什么呢?正如我们之前看到的,其实日本在很早就有深厚的神经网络研究底蕴,像甘利俊一、福岛邦彦等学者都是这个领域当之无愧的先驱。事实上,在二十世纪八十年代,当几乎全世界都抛弃了神经网络之时,还有不少日本学者坚持做这方面的研究。据“深度学习革命三杰”之一的杨立昆(Yann Le Cun)回忆,1988年他构思“卷积神经网络”(Convoltional Neural Networks,CNN)时,能够查到的文献几乎都是日本人写的。然而,正是这样一个神经网络底蕴深厚的国家,在深度学习革命到来之时,却出现了相关人才青黄不接的现象。全国押注第五代计算机带来的导向作用很可能是一个关键原因。毕竟,在研究专家系统的收益肉眼可见地高于神经网络时,谁又会选择这样一个冷门专业呢?而当第五代计算机的梦想在二十世纪九十年代最终破裂后,日本干脆削减了对整个AI学科的资金扶持,这就导致了最优秀的人才根本不愿意进入这个领域。
日本的背运还不止于此。本来,在日本的经济实力如日中天之时,很多日本企业曾到美国开办实验室,它们曾在当地招揽和储备过大批的AI人才。其中,最有代表性的就是NECLab,它由著名的日本电气株式会社(Nippon Electric Company,NEC)于1988年在硅谷成立。曾经,包括杨立昆、瓦普尼克(Vladimir Vapnik)、伯托(Leon Bottou)、龚怡宏等在深度学习领域举足轻重的人物都曾经供职于NECLab。然而,这些人才一个也未能被日本所用,而是先后出走,为美国和中国的深度学习事业作出了巨大的贡献。之所以会有这样的结果,一是由于NECLab本身的导向有误,只重理论,不重现实,这让本应高度与实践结合的AI人才毫无用武之地。二是它的管理十分僵化。比如杨立昆就因去普林斯顿大学讲学未经报备而遭到了实验室领导的批评。在这种情况下,NECLab当然就很难留住人才。
国内人才断层,国外人才又留不住,这些原因加在一起,就导致了日本在深度学习高歌猛进之时,完美地错失了这次革命。尽管这几年,日本政府已经发现了问题,开始尝试用政策鼓励AI的发展。“冰冻三尺非一日之寒”,至少到目前为止,这个曾经的未来科技大国仍然在最近的生成式AI大潮中处于一个可有可无的位置。
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。