最近,一个名为华智冰的学生走进了清华大学,还大众面前“高调”亮相,因为这是中国首个原创虚拟学生。
一时间,大家纷纷感叹,原来虚拟人物还能读大学!据报道,华智冰双商都很高,可以写诗作画、创作剧本杀,还具有一定的推理和情感交互的能力。
未来离我们如此之近。
那么,华智冰这样的AI究竟“进化”到了什么地步?为什么AI能进行艺术性质的创作?人类智能和人工智能的差别会越来越小吗?AI最终会超越人类吗?
微软亚洲研究院被誉为“世界上最火的计算机实验室”,洪小文院长在名为《人工智能的突破和数字化转型的未来》的演讲中全面分析了这些问题,同时也讲述了为何数字化转型对企业至关重要。
值得一提的是,华智冰是由北京智源人工智能研究院、智谱AI与小冰公司共同打造的,而小冰公司的前身就是微软(亚洲)互联网工程院人工智能小冰团队。
相信洪小文院长的这篇演讲能为你揭开关于AI现状和未来的神秘面纱。
分享人 | 洪小文 微软全球资深副总裁 
微软亚洲研究院院长
编辑 | 混沌商业研究团队
本文为混沌商业研究团队“读书”栏目
整理自《未来已来:全球领袖论天下》,本文演讲时间为2019年11月11日,文内略有删改,中信出版社2021年3月出版
文末混沌君送你3本书
中国有个成语叫“知往鉴今”,意思就是了解过去作为今天的借鉴。我经常开玩笑说,AI火热是因为“人工”的反面是“天然”,“智能”的反面就是“愚蠢”,因为没有人想做天然的愚蠢,那当然就喜欢AI了。
AI这个学科虽然和其他学科比起来历史没有那么悠久,但是也有60多年了。1956年我的师祖(老师的老师)约翰•麦卡锡在达特茅斯会议上提出了AI这个概念,然后AI经历了两段著名的寒冬。
记得我刚毕业的时候是1992年,那正是AI第二段寒冬的尾巴。当时我们学AI的人毕业都不敢讲自己是学AI的,我们就说是做语音的。那时如果跟人家讲自己学AI是找不到工作的,而今天是你不做AI都要说是做AI。起初,AI在学术上的定义其实没有大家理解的这么宽;但今天,基本上计算机能做的,大部分人认为就是AI。
AI跟经济有很大的关系,大家都预测到,未来的经济很多都需要靠AI推动。AI对GDP增长的贡献值如图11.1所示。
图11.1 AI对GDP增长的贡献值
智能金字塔
图11.2是1950年一期《时代》杂志的封面,那期杂志里有一篇文章说了这么一句话:“对于拥有‘超人’力量的机器,现代人已经习以为常,但是拥有‘超人’脑力的机器仍然让人们感到恐惧。‘超人’的设计者否认他们正在创造人类智力的竞争对手。”
计算机是在第二次世界大战期间诞生的,当时美国跟德国都想要做原子弹来制服对方,那时有一个“曼哈顿计划”,所以才开始做计算机。1950年的时候,AI还没有被定义出来,达特茅斯会议都还没有召开,第二次世界大战结束五年后,全世界的计算机还不超过十台,而且每一台计算机都有一个房间那么大,其运算能力、储存能力比今天的智能手机还差。
在那个时代,大家很担心有人会造出比人类还聪明的计算机。我们并不害怕大型机械,如飞机、汽车,但是却在AI还没有影子的时候就感到害怕,这代表了大家对智能这件事情,真是既期待,又怕受伤害。这也说明了为什么大家这么关注AI,包括很多人对AI产生了不那么正确的看法。
图11.2 1950年《时代》杂志的封面
我把智能的发展画成了一个金字塔(见图11.3),自下至上,从简单到复杂分别为计算和记忆力、感知、认知、创造力和智慧这五层。
最底层的是计算和记忆力。我们中国人的老祖宗很厉害——“神机妙算”和“过目不忘”,这是很智能的表征,“神机妙算”就是计算,“过目不忘”就是记忆。不管是图灵机还是冯•诺依曼机,都包含了CPU以及存储两大基本组成,计算机靠这两样东西就可以运算所有程序。
回想到我人生的第一次挫折,就是我小学一年级时没有被选进珠算队,而今天大部分人显然都不会送小孩学珠算。在我们那个年代,珠算也分等级,就像下围棋一样,大家觉得一个人很会用算盘、会珠心算,是非常了不起的。用算盘可以进行很复杂的计算,甚至可以开根号、做三角函数。当时我的老师告诉我:“你的身体没有那么好,课后你还是回家休息吧,不要参加珠算队。”听完后,我当时的感觉是因为自己不够聪明,所以才没有入选珠算队,我很难过,直到高中时才从这件事的打击中缓过来。
图11.3 智能金字塔
而今天已经没人认为算得很快有多了不起,没有人跟计算机、计算器比计算,也没有人跟计算机比记忆。我自己搬家三年,到现在都不记得自己家里的电话。如果我写十个电话号码,让大家记,十分钟以后,我说出一串数字,问你是不是我刚才说的号码中的其中一个,大部分人可能都答不上来。既然今天计算机可以帮我们计算、记忆,我们就可以很放心地让它来做,计算机比我们强没有关系。
自下而上第二层到了感知。还要说我们的老祖宗很厉害,“聪明”这两个字就是“耳聪目明”,计算机视觉很强,语音识别很强,就是聪明。“千里眼”和“顺风耳”都是关于感知这件事的,事实上,这一波AI的复兴都跟感知有关。
在视觉方面,2015年1月,微软亚洲研究院开发的计算机视觉系统,在ImageNet(可视化数据库)挑战赛中首次超越了人类对物体识别分类的能力。同年12月,微软亚洲研究院设计发明的前所未有的、深度高达152层的残差网络ResNet,将识别错误率进一步降至3.57%,而人类的错误率大概是5.1%。
在语音识别领域,2017年在全球最权威的产业标准 Switchboard 语音识别基准测试中,微软的语音识别系统将错误率降至5.1%,准确率超过专业速记员水平,也就是说超越了普通人类。这次突破大幅刷新了此前的纪录,并在语音识别行业树立了新的里程碑。
计算机可以完全听懂人讲话,这在以前是不可思议的。计算机的语音识别技术有很多应用场景,例如充当法庭里的速记员,像我们今天用的智能音箱、智能助手也都是语音识别方面的应用。在语音识别方面,看起来计算机已经超越我们人类了,事实也的确是这样。
计算机视觉方面的应用更多。例如在海关工作的稽查员当天接到500名嫌疑犯的照片,需要时刻检查有没有这500名嫌疑犯中的一个或几个通过这个关口。我相信很多人还是会辨认错误,而且这样的工作也非常枯燥。如果计算机能够帮助我们很好地完成这样的工作,那么感知这部分就让计算机帮助我们吧。
自下而上的第三层是认知,目前AI的进展也刚好处于这一阶段。刚才讲到的计算机视觉和语音识别都是人工智能在感知层面上的进展,但要让计算机更加理解人类,我们就需要对认知层面进行探索,而自然语言理解就是认知层面的核心。认知的英文叫cognition,心理学上,认知心理学是非常重要的一支。认知基本上是指我们对一件事情的“理解”,以及从这件事情中“洞察”到什么,还可以进行“推理”,做一个“计划”,最后做出“决策”。
认知其实是工作和生活中最有用的东西。工作上,例如政府官员要制定政策,公司管理层要根据市场变化相应调整产品策略等,这些都是基于认知做出的决定。
我们来看看今天计算机和人类相比做得怎么样。
近两年来,微软在自然语言方面有很大的突破。2018年1月,微软亚洲研究院研发的机器阅读系统在由斯坦福大学发起的机器阅读理解挑战赛SQuAD中率先超越人类水平。这是计算机文本理解能力首次超越人类,预示着该领域的研究以及应用都将会有更大突破。2019年3月,微软亚洲研究院与微软雷德蒙研究院合作研发的系统,首次在斯坦福大学发起的对话式问答挑战赛CoQA 中各项指标都超越人类水准。
我想大家都有参加英语考试的经验,高考、托福、GRE(美国研究生入学考试)、SAT(美国学术能力评估测试)中都有阅读理解题型,大多数人是考不了满分的,而计算机可以在这方面超越人的平均水平。辨认到理解是非常难做的事情,计算机也可以做得很好。
另一个就是翻译,微软中-英机器翻译的水平已经可以“与人类媲美”。我们都知道,翻译的前提是理解,计算机虽然无法理解,但是可以翻译得非常好。像我个人根本不会讲法语,但是我们可以利用机器翻译,到法国巴黎的时候顺利买到歌剧的票。
2019年,在由国际计算语言学协会(The Association for Computational Linguistics)举办的WMT 2019国际机器翻译比赛上,微软亚洲研究院参加了11项机器翻译任务,其中8项荣获第一,并凭借多维度的技术创新成为冠军团队。这也让我们在帮助人们打破语言交流障碍的道路上又迈进了一步。
“微软小冰”不仅做智商上面的问答,还有情商方面的问答。小冰这样的对话机器人,在学术界的价值非常高。
大家知道,艾伦•图灵是计算机的始祖,他在AI还未被定义的时候,就想到了“图灵测试”。该测试是,有两个房间,一个房间里是真人,另一个房间里放机器,人跟机器对答,假如说40% ~ 60%的人分不出哪个房间里面是真人,哪个房间里面是机器,那么图灵测试就通过了。很多人通过图灵测试判断AI有没有通过人的智能考量。
小冰虽然没有去做很严格的图灵测试,但微软一直以“用户和小冰每一次对话大概交互几轮”来作为衡量她的KPI。在微信上,我们跟最熟悉的朋友、亲戚对话,每一次也大概不过5轮。大家明明知道她是一个机器人,还愿意跟她谈20轮以上,肯定是她谈了一些有意义的东西,让你欲罢不能。从某种意义上说,小冰已经远远超过了图灵测试。我们让小冰变成人们可信赖的伙伴,我们还可以以她为基础发展一些商业领域的应用,更重要的是做一些科学实验。
AI在商业领域的应用,大部分是基于它的认知作用。而认知的进化主要来自一个反馈闭环(见图11.4),该闭环依靠传感器和执行器两大部分,主要表现为物理世界通过传感器搜集数据并将数据传输给系统,系统针对传输数据进行分析后做出决策,并将决策反馈给执行器,最后由执行器在物理世界中执行来实现决策。人工智能在闭环中扮演最重要的分析与决策角色。
图11.4 进化来自反馈
物联网就是跟物理世界打交道,其中传感器是搜集数据的,执行器用于在物理世界中执行。比如说,我们要控制一条河的水质,传感器能够检测水质,执行器用于控制排放污水的开关,在没有互联网的时代,我们需要派人专门去那里执行,现在有了物联网,我们可以远程控制,比如说这个小区的水不要排进来,那个小区的水可以排之类的。
几乎所有的事情,每完成一次闭环,就能够有所改进,包括做社会心理学分析、做实验、做假设、做产品,或是做互联网都是如此。如今,基于获得的数据,可以由AI进行分析跟决策,即所谓认知。如果我们有一个闭环,又有办法搜集到数据,就可以把它自动化。很多AI的商业应用,都可以抽象为这样的事情。
制造业是首先享受AI成果的行业,使用AI已经成为常态,比如可预防的维修。
例如,蒂森克虏伯电梯集团是微软的客户之一,遇到电梯出故障的情况,以前公司会先打电话给维修人员,维修人员来搜集一些数据,然后回实验室分析几天,分析完之后发现可能有一个零件坏了,再去配零件,又隔了几天,零件来了,维修人员再到这部电梯里把零件装上去,最后这部电梯就可以恢复运转了。但是这期间,电梯起码需要停运几天,甚至几个星期。
现在蒂森克虏伯电梯集团已经不再这样做了。他们先在电梯里安装好传感器,用于搜集速度、声音、温度等数据。我们可以把这个过程当作一个“黑盒”。传感器把数据搜集好以后,系统起码可以做下面两件事情。
第一,异常分析。公司用深度学习或机器学习方法建模:状态正常时数据应该在一个区段,快要出故障前数据在另一个区段。当数据处于快要出故障的区段时,公司就可以做预防性的维修,提前派维修人员到现场,很多时候可能加几滴油就行了。
第二,数据搜集得够多后,还可以做分类,公司不但知道它快坏了,甚至还可以将问题分成不同的情况,针对每种情况有不同的处理方法,有的加些油,有的换零件。
同样的道理可以运用到许多其他领域。
比如汽车的维护。很多人的汽车每6个月要回厂维修一次,换一些过滤器等零部件,但是每个人开车的习惯不一样,城市、天气、路况都不一样,如何判断每辆车多长时间换一次零件合适呢?现在我们有了车联网,车联网将所有车里的数据上传到云端,就可以实现预防性的维护。
人体医疗保健也是如此。穿戴式设备可以将人的生物特征收集起来,在人快生病的时候,甚至在癌细胞达到一定数量后,系统提醒人们到医院预防和治疗。
微软的客户之一劳斯莱斯,除了汽车业务,也做飞机引擎。在引擎方面,微软至少可以帮助做两件事。
一是可预防的维修。飞机延误的部分原因是检查出引擎发生问题,其造成的经济损失非常巨大,所以防患于未然非常重要。
二是降低油耗成本。飞机飞行的花费约40%是在油耗上,每次飞行载的油多就会费更多油,因为飞机更重了;载的油少就会危险,不能飞到一半油不够。劳斯莱斯在驾驶员出发前,可根据引擎状况、天气状况、风速等数据判断加多少油合适。
当然这些例子也并不代表AI可以做所有事情。
“黑盒”与“白盒”
当前的AI主要是“黑盒”模式,它基于大数据的模式识别推理,可以解决“是什么”的问题,但不能解决“为什么”的问题,因此不同“黑盒”系统之间的因果推理几乎是不可能的,所以,很多人把它说成不可解释的AI。
那么“白盒”是什么呢?人类认知更多是“白盒”推理,能够进行因果分析,还可以举一反三,在不同“白盒”系统间可实现认知和推理。
1980年,斯坦福大学心理学系教授约翰•塞尔做了一个实验来挑战所谓图灵测试,他的实验叫“中文房间”。一个房间里有一位不懂中文的人,但给他一本很全的词典,每次给他递进去一张写着中文的纸,里面的人通过大词典查纸上每个汉字,我们假设他可以查到所有的文字,可以对照列出字词的组合。房间里的人不会说中文,他不能够用中文思考。但因为他拥有某些特定的工具,他甚至可以让以中文为母语的人以为他能流利地说中文。而目前的AI就是这样工作的。它们无法真正地理解接收到的信息,但它们可以运行一个程序,处理信息,然后给出一个智能的印象。塞尔用这个实验来反驳“计算机和其他人工智能能够真正思考”的观点。计算机即使通过了图灵测试,也不是真正的智能,因为它不能够真正理解文字的意思。
塞尔还举了一个实例,假设今天找一个人做翻译,让他翻译“我是一个白痴”这句话,然后这个人一定会说“你才是白痴,我才不帮你翻译”之类的,但是如果把这个指令给机器,机器一定会乖乖说“I am an idiot”。
所以,塞尔教授认为这种模拟思路,没有思维和理解的叫弱人工智能,真正有思维和理解的叫强人工智能。前者具备观察和感知的能力,可以做到一定程度的理解和推理。目前的研究都是集中在弱人工智能这部分。而强人工智能,期待可以获得自适应能力,能够解决一些之前没有遇到过的问题。但目前看来,强人工智能还遥不可及。
有了真正的思维和理解,才有可能进行所谓“白盒”推理,也就是最重要的因果分析。必须要知道因果关系,才能举一反三。事实上今天AI大多做的是相关性,做不出因果关系。
比如做投资并购等商业决策。微软最近几年收购了全球最大的职业社交网站LinkedIn(领英),2018年还收购了GitHub(代码托管平台),这都是比较有名的并购案例。那么能不能把并购这种商业决策交给机器做呢?
我的答案是不能。
因为并购不是封闭系统,它有许多外部因素,而且这些因素无法预测,也没有那么多数据,可能另一家也想跟一起并购,就会把价格抬高,这个时候到底该不该买?我们人生重大的决定都是这样,你可以做各种分析,但是最后还是有很多未知因素。
还有时候,AI会导因为果。比如,“公鸡叫”和“太阳从东边出来”,哪个是因,哪个是果?今天的AI搜集了一些数据,分析出“太阳出来”和“公鸡叫”有很大的关系,然后就做所谓深度学习,最后算出“公鸡一叫,太阳就要从东边出来”,就是导因为果了。
可能有人会想:这怎么可能呢?太阳当然是从东边出来,所以才导致公鸡叫。但是别忘了,那是因为我们有其他数据和知识支撑。曾经几千年来,人类一直认为地球是宇宙的中心,当伽利略提出地球不是宇宙中心的时候,大家都觉得不可思议,教皇还要抓他。
今天,所谓深度学习是一个不可解释的AI,是“黑盒”模式,做不了因果关系的分析。所以,可解释的AI是今后一个很重要的方向,而且非常难。30年前有一位图灵奖得主,是加州大学洛杉矶分校的教授朱迪亚•珀尔,他做了一辈子因果关系分析,估计AI起码还要在十几年或二十年以后才会解释“为什么”,才有可能做“白盒”分析。
《人类简史》和《未来简史》都是大家比较熟悉的书,2019年又出版了《今日简史》,里面说将来大数据能做所有的决定,甚至包括我们的婚姻。我是持不同想法的。我们中国人的婚姻讲究先看八字,但是我们也没有全信,未来是未知的,把这么重要的事全部交给“黑盒”,似乎欠妥。但是这不代表AI没有用。
所以,我把它改成图11.5,这张图跟图11.4唯一的差别就是,分析和决策是AI和HI(人类智慧)一起做的,人做决定的时候需要看大数据,但是不代表大数据会决定一切。有些东西用大数据来做决策是可以的,比如前面我们提到的可预防维修,机器可以解决比较简单的问题。但我们也不要妄自菲薄,低估人类的智慧,很多时候大数据分析代表着有这样的概率会成功,但是最后不见得选择最大概率的方案就一定成功,这里面还有很多随机的因素。
图11.5 AI+HI

智能金字塔的自下而上第四层是创造力。从计算和记忆力、感知到认知,AI已经做得很好了。但是创造力方面目前人类能做得更好。
近些年,深度学习可以用于“创作”,比如说诗词创作。2018年我们用这个技术教微软小冰写诗,小冰还出了诗集《阳光失了玻璃窗》,当时很多人说这一定不是计算机做的,但事实上真的是!
现在,通过大数据分析,小冰不但能写诗,还可以看图写诗(见图11.6和图11.7)。
图11.6 看图作诗1
图11.6中,有月亮,有波光粼粼的水面,对面是灯火阑珊的城市。小冰根据这幅图,就可以写诗。
那繁星闪烁的几天苍色
那满心的红日
看万里天使在世界
我就像梦
看那里闪烁的几颗星
西山上的太阳
青蛙儿正在远远的浅水
她嫁了人间许多的颜色
图11.7 看图作诗2
像每一座城市愧对乡村
我才有一个美好的完成
每个失眠的夜晚我是一个花言巧语的人
隐匿在灵魂最迷失的火
绕出城市的边缘
美好的
在风里
最轻微的触动
小冰既可以写诗,也可以写歌——先作词,再谱曲。如图11.8。如图所示,词和曲合起来就是这样,各种类型的音乐,比如乡村的、嘻哈的、古典的,小冰都可以写出来。
图11.8 《秋水》
在绘画方面,根据一种喜欢的画风,机器就能将图像结合到绘画上去,可以“画”得非常好,但这在技术上是很难的。
图11.9 风格迁移(Style Transfer)效果
那么,以上这些例子是不是代表计算机真的有创造力?
其实创作这种东西,特别是艺术的创作,还是要有自己的想法。今天AI可以产生这些东西,但是不代表它知道为什么产生,因为它是“黑盒”分析。假如今天我们让计算机画出所有世界上40×60的画,计算机都可以画出,但要问它其中一张要表达什么,这需要的不是IQ(智商),而是EQ(情商)。计算机能创造,但不代表它有像人一样的创造力。
而从现实世界的角度看,我们把创造力定义成解决问题的步骤,这个算法就是创造力。
比如,数学家高斯小时候很聪明,数学老师有一天丢给他一道题,让他从1加到N,他觉得这个N很大,数学老师觉得这一次高斯要花半小时,结果高斯不到一分钟就告诉老师答案,这就是我们现在熟知的(N+1)N/2。
其实从1加到N,至少有两种算法:N×(N+1)/2;从1一直加到N。
我为什么讲这个例子呢?如果今天你跟计算机比赛,计算机用比较笨的方法,从1一直加到N,你用N×(N+1)/2的公式法,假设这个N很大,谁会先算出来?还是计算机,因为计算机算得实在太快了。
此前热议的AI下围棋,李世石先生和柯洁先生的算法来自他们自己,计算就是用他们的脑袋来算;AlphaGo的算法则来自十几个科学家,计算也丢给了上万台机器在云端计算,这本身就是一个不公平的比赛,因为计算机可以算得非常快,人算得不够快。如果李世石和柯洁还有一点点赢的希望,那么他们的算法肯定有独特的地方。
今天大家常常说,谁做了某个AI,人类没希望了,事实上大家忘记了一件事,今天计算机所有的算法都来自人,如果有一个人告诉你有一个计算机可以自己想出算法,那绝对是吹牛。从这个角度来看,人类大可不用担心计算机会超越我们。
如果你仔细看这些脑神经科学家做的实验,归纳的左脑和右脑的特征,你会发现左脑主要与逻辑、顺序、分析、数字化、理性、模式认知、基于事实等相关,右脑则与直觉、随机、综合、主观和创造性等相关(见图11.10)。
图11.10  左脑和右脑
所以,其实计算机跟人类正是左右脑互用的关系。人们用右脑进行创作,用左脑进行计算、求证。有超强计算和记忆功能的计算机在未来就可以成为人类的“最强左脑”。
这就像我们可以走路,但走得不够快,就通过乘坐汽车或飞机等交通工具提高速度;我们也能记忆,但我们没有办法记那么多,所以就创造出计算机帮我们记忆;运算也是如此。但是这些想法、算法都来自我们的大脑。
意识是人非常特殊的一个东西,我们随时知道身体在哪里,面对的是谁,我们的意识无处不在。植物肯定是没有意识的,动物里面只有少数哺乳类有意识。心理学家和脑科学家都做过自我识别的测试,就是在动物或者人前面贴一个贴纸,然后给它/他照镜子,如果它/他知道贴纸不是自身的一部分,就会动它,甚至把它拿掉,这叫作镜面自我意识。大部分哺乳类动物都没有通过测试,包括狗和猫也没有通过。大部分猴子也没有通过,我很惊讶,但大部分猩猩通过了,鲸鱼和海豚也通过了。虽然大部分猴子没有通过,但是据说经过一个月的训练后,它会知道贴纸不是自身的一部分,所以猴子也是可以学习的。
有一本书《心灵潮汐:揭示意识的光谱》(The Tides of Mind:Uncovering the Spectrum of Consciousness),是耶鲁大学的一位教授写的,他在书中探讨意识和创造力之间的关系,他把一个人一天的生活分成两个阶段:高谱系、低谱系。
高谱系就是我们早上起来的时候,喝一杯咖啡,精神很好,做什么事情都不会记错,也不会算错。低谱系就像我们吃过午饭,打一个盹,甚至做梦、睡着了,还有洗澡的时候,这些时候叫低谱系。
几乎所有做脑科学的人得出来的结论都是:大部分人不是在高谱系的时候最有创造力,而是在低谱系的时候创造力更强。虽然这并不完全绝对,但还是有很多历史上的佐证。贝多芬创作《第九交响曲》的时候既聋又盲;凡•高割掉了自己的耳朵,但还是可以画出了不起的作品。
甚至有两个科学家——凯库勒、奥托•洛伊维。他们清楚地记起他们重要的科学发明是在做梦的时候想到的,尤其是洛伊维,他第一次做梦的时候,梦到了实验方法,第二天早上起来,他知道他梦到了该怎么做那个实验,可是他忘记了内容,晚上睡觉又梦到和前一天一样的梦,他这一次醒来后马上把它写了下来,最后凭借在梦中的发现获得了诺贝尔奖。
当然听完这个故事,可能有同学会说想创造就要多睡觉,所以我要特别讲凯库勒和洛伊维都说光睡觉没用,光睡觉最多给你大胆假设,但要小心求证,还是要到实验室做无数实验来证实。
我觉得更重要的是看背后的原理。很有可能两件看似无关的事情,在神志清醒的时候很清楚地知道它们无关,但是半梦半醒的时候,就可能看到这两件事情的相关性,创新常常是在这样的过程中产生的。
所以要做出一个有意识的机器,首先要让计算机能够幻想,这是很难的。当然人在低谱系时,十道计算题可能会算错一两题,但如果故意让计算机每十题错一两题,这不叫真正的幻想。
怎么让计算机有真正的幻想,进而产生了不起的创造力呢?没有人知道。
智能发展的最高层就是智慧
弱AI这种单一用途的“黑盒”已有应用。强AI是什么?事实上,就像通用AI,每样都懂一点,很多东西我们不是专家,但也总能想出很了不起的想法。我的师祖约翰•麦卡锡当年召开达特茅斯会议,人家问他这种通用AI多久可以实现,他给了一个很有智慧的回答:5~500年。我们知道当然不是5年,500年又相当于永远,所以实在不知道什么时候会发生。
刚刚讲到意识和创造力好像有关系,但是做一个有意识的机器人,本身有没有现实意义呢?我个人觉得可能没有什么意义。为什么呢?我常常举一个例子,就是倒咖啡。假如我让我太太帮我倒咖啡,十次里面有五次她会说“你自己有手有脚,为什么不自己去弄”,我会说“你讲得太对了,我就自己去弄”。如果我今天做一个AI机器人,十次里面只要有一次它不弄,就说明它是有问题的。
做一个有意识的机器人代表你不能控制它,你可以想办法给它洗脑,但是不见得会成功。所以,我觉得做一个有意识的机器人虽然在科学上很有意义,但是不见得有太多现实意义。
我还经常举一个例子,如果你真的要做一个跟我们一样聪明,甚至比我们聪明又有意识的东西,我建议大家现在响应政府的号召,多生一些小孩,因为我们巴不得我们的小孩比我们聪明,而我们也不能控制他们。
我们应该怎么看待AI呢?我非常乐观。的确,AI的关键是人,而创造技术的目的是更好地拓展人类的局限。它大部分跟工具一样,是在帮助人类做事情,而且它跟人类很互补——人类有创造力,可是算不快,记也会记错,AI恰恰可以弥补这些问题,所以我把AI叫作大数据驱动的知识。我们应该很庆幸,我们是第一代跟AI一起生活的人类,而且我自己的经验是,对AI的研究,帮助我更好地了解了人类智慧是怎么回事。
记得我小学的时候认为会珠心算是很了不起的,现在我不这样认为了,现在我认为人更高阶的东西是人类智慧和机器智能的共进化。
人工智能与数字化转型
我们今天到底处在什么时代?是一个彻底的数字化时代,从文字、数据库、交易、信息知识再到物联网、数字化孪生等方面都有所体现。
先是文字被数字化,最早办公是用纸质文件,后来用软件,所以成就了微软这样的公司,Office里面的Word、Excel、PPT等是第一批被数字化的东西。然后是数据库,甲骨文、微软、IBM这些公司取代了手动“记账”。再后来是商业化交易,阿里巴巴、京东等电子商务公司将交易彻底数字化。信息和知识的数字化就是我们的互联网,从一开始的门户到搜索,都属于数字化。多媒体方面,以前有大大小小的各种盘,现在全部变成了流,音乐流、视频流。
为什么数字化彻底改变了我们的世界呢?就是数字化孪生。任何物理世界的东西,不管是人或者是物,都会有一个数字化孪生兄弟,数字化孪生至少有两大意义。
第一,预测。就像我们刚刚讲的马达、机器、引擎、医疗器械,它自己在物理世界里根本不知道快坏了,但是在数据世界的它知道快要坏了,可以做可预防的维修。人在看电影,都不知道下一部要看什么,但数字化孪生已经知道了,并准备推荐一大堆电影。
第二,模拟、仿真我们就拿无人车和无人飞机举例,它还没有在路上走、没有到天空中真正飞以前,一定要在它的仿真世界走上几万小时,飞上几万小时才会比较安全。一个国家、一个公司的政策,都可以用仿真的方法去做很多实验。
大家可能会问:为什么微软会重回市值第一?为什么我们转型这么成功?因为彻底的数字化世界,需要无处不在的计算——智能云及智能边缘,我们要实现以人为本的计算。
微软CEO萨提亚•纳德拉出版了《刷新》一书,该书分享了微软转型的经验。在客户沟通方面,微软可以用数字和AI的方法,跟客户拉近距离:从被动的角度,客户有问题时帮他们服务,叫智能客服;从积极的角度,把客户变成市场运作的一部分,让粉丝帮你销售,是更了不起的。在运营方面,微软正在努力让每个部门(包括我们的运营部门)更有效能、效率。
在赋能员工方面,前一阵很多人在讨论“996”,我认为这是完全过时的想法,因为今天的职场,大家在工作上可能要处理一些家里的事情,在家里可能要处理一些职场的事情。所以,要让员工不但把工作做好,还把家庭照顾好,这样才可以鼓励员工长期与公司和单位合作,还可以激发员工的潜能和创造力,使其能够替公司产生更了不起的创意。
数字化转型其实很多都是在自动化、优化,改进决策,所以能够产生新的产品、服务,做新的商业模型,提高生产力。
做数字化转型,平台和技术很重要,但人是最难改变的,这对领导力、组织、思想、文化的挑战更大。
微软联合德勤会计师事务所针对全世界的大、小、中型企做了调研:90%的企业已经认识到数字化转型的重要性,但是只有30%的企业认为它们已经开始数字化了,其中只有15%的企业认为它们自己就可以胜任数字化转型的任务。这其实也解释了为什么微软能转型成功。同时,微软也是企业最好的数字化转型伙伴,是最忠实的技术和平台伙伴,这也是最近微软能够有如此好成绩的原因。
图11.11 微软云计算 + 人工智能平台
大家很关注AI,事实上AI没有数据和计算是转不起来的,所以更希望大家多了解ABC(A指人工智能,B指大数据,C指智能云)。图11.11是微软的云计算平台和AI平台,如果今天要做一个平台来帮助公司做数字化转型,最底层就是计算,包括芯片、CPU、GPU等,还要有一个数据平台,有结构化的数据、非结构化的数据,用处理数据的一些工具做数据挖掘,上面还有AI的机器学习,然后去做实验,把数据放进来,最后做出AI的应用,应用于首先能够在数字化转型上得到益处的行业。
AI For Good(人工智能造福人类)。技术变得越来越重要的同时,与技术相关的负面隐忧也相应增多,如隐私安全、假新闻、偏见等,甚至AI会不会取代人类导致大规模失业。
我觉得一个产品或是技术,最后都反映了人的价值观,因此产品的建设需要多方的利益相关者来参与,除了做技术的以外,商业专家、经济学家、公共政策者、心理学家、律师等,都需要一起来探讨。
当今时代工作场所发生了巨大的变化,两百多年前,绝大多数人都从事农业工作,而今天这个比例则很小,那么其他人都失业了吗?显然没有,因为工业革命产生了更多新的价值。所以,与其担心技术会不会夺走我们的工作,还不如关注如何让我们和我们的下一代保持终身学习。
未来的发展道路非常漫长,让我们一起努力!

朱民对话洪小文
Q:我也是一个AI的业余爱好者,当然不专业了,因为我是一个可怜的经济学家。AI发展很有意思,现在发展到了哪个阶段?
A:大概就在中间“认知”这个阶段的一半。
Q:往上还能走多远?
A:刚刚讲到认知这里,就是“黑盒”模式和“白盒”模式,现在还是不可解释的AI阶段(“黑盒”模式),如果能做到可解释的AI阶段(“白盒”模式),它有可能再往上推。
Q:可能的途径是什么?因为“黑盒”和“白盒”是两个完全不一样的概念,从“黑盒”到“白盒”迁移的过程可能会怎样发生?
A:我先讲比较实际的,这些大数据会帮助我们走向“白盒”,毫无疑问,我们也不能够完全空想,因为没有数据。
所以,从这个角度来看,其实“黑盒”已经帮助我们做了一些“白盒”的因果关系分析了,当然今天讨论的是能不能全自动做因果关系,假以时日绝对可以往上推,但是能不能推到100%我不敢讲。我觉得人跟机器最后可能还是有差别的,今天的AI大部分是大数据,人类的智慧大部分是小数据,甚至是无数据。
一百多年前爱因斯坦根本没有什么数据,但他推测出了黑洞和引力波。一百年以后,我们用今天最好的科技,勉强测到一些黑洞、引力波的信号,还要一大堆最了不起的科学家合起来才能够做到。所以我也不知道爱因斯坦是怎么在没有数据的情况下想出很多观点来的。
Q:小文是卡内基梅隆大学的高才生,本科毕业于台湾大学,是AI的祖师爷约翰•麦卡锡的弟子的弟子,所以是正宗的传人,符合金庸写的出身名派。那您相信奇点吗?
A:我其实不太相信。提出奇点理论的是雷•库兹韦尔,他很聪明,但是我不太同意他讲的。奇点理论就是指人工智能的能力超越人类的某个时空阶段。
为什么我不同意呢?我还是有科学根据的,比如20世纪的几大难题,大部分被解决了,但是不能解决的东西,到现在也没人会解决。我的意思就是,当我们解决了一个难题,下一个难题会更近吗?其实不见得,我们今天还有很多未解的问题,每个领域都有一些未解的问题,包括我们从哪里来、宇宙有没有大爆炸、我们会走向哪里等问题。
Q:您这个说法跟您前面的判断是矛盾的。您现在的这个判断是,人类发展的道路,每一步前进不意味着未来也可能会继续前进。
A:对啊,是不知道的。
Q:但是跟您前面的推断是不一样的。您在“智慧金字塔”的推断是,AI通过不断学习,可以逐渐走向智慧。
A:但是我不知道要多久。
Q:您不知道多久,我也没讲多久,500年、5000年都可以,但是这两个推断的逻辑是不一样的。您在“智慧金字塔”逻辑中,明显对AI的发展更为乐观,现在则是对未来充满了未知。未来是未知还是可知?
A:未来也可知,也不可知。
Q:经济学家回答问题的方式,被科学家用了,(可知与不可知)这件事情有点儿麻烦,怎么解释?
A:这里有好几种解释方法,第一种是比尔•盖茨讲的。他说人通常对于短期的事情过分乐观,但是对于长期的东西又过分悲观。就是说很多人乐观地认为,AI走向智慧再有几年就可以做到了。
Q:其实这句话讲得很精彩,您觉得我们现在对AI过分乐观吗?
A:肯定有些人过分乐观,像你提到的奇点理论,就是过分乐观了。但是长期,到了500年,或许……
Q:就是我们对它潜在的未来看得不够?
A:对,关于这个问题我只代表自己,我真的觉得有可能有些东西人类是永远不会得到的,包括我们到底可不可以创造一些东西,甚至我们能不能知道到底有没有神,或者是人类将会走向何方。因为我觉得,如果我们知道所有事情的结果,可能很多人会认为再活下去就没什么意思了,探索未知本身就是人的使命。万一我们最后探讨,人类所处的世界其实是外星人做的一个实验,我相信很多人会很悲观。
Q:您相信吗?
A:我不知道,我只能说我不知道,不知道本身是一件好事。
Q:我曾经和一群世界级的天文学家讨论这个问题,大部分人相信这是有可能的。
A:我觉得有可能,但是不能证明。
Q:我们的悟性还不够,还看不到。所以,我想问您,AI通过技术和数据的演化,会不断地逼近人的智慧,这是可能的吗?
A:有可能。
Q:“黑盒”有可能走向“白盒”?
A:有可能。
Q:但是这条路很长、很曲折,这条路怎么走,什么时候走到“白盒”,会不会走到奇点?您表示怀疑?
A:我觉得基本上不可能,你这样想,奇点要发生,就是说AI它可以自己去解决问题,或者是自己想出新的算法,而且它也不会累,它就可以把全世界的问题都解决了。这样的话,我觉得人活着的意义可能就减少了一大半,人类探讨未知,至少科学家在探讨未知,假如有一个人帮你全部解完了……
Q:但是人永远处于低谱系的状态不是很好吗?用您的说法,可以创新,做别的不也很好吗?
A:我虽然不是经济学专家,但是有可能我哪一天一做梦,去创造出对理解经济很了不起的东西,这是可能的,这种希望让我觉得我的生命很有意义,我觉得希望本身就是一个很有意义的东西。假如说以后没有希望了……
Q:这是一个哲学问题。
A:对。
Q:这真的是智慧。您非常骄傲地讲到了微软小冰,小冰的成长过程中可能发生过一些很有趣的现象,比如它学会了说粗话,比如它有性别意识和种族意识,机器在和人的交流中,会把人的一些不良行为进行分辨、分析、储存、记忆,并且变成它的行为,这怎么解释呢?
A:我认为AI的关键还是人。我举个例子,一把菜刀,大部分是被好人用来切菜,极少数情况下被坏人用来杀人,最后能说是菜刀的错吗?一定是人的问题。
Q:您又一次提到了大数据和小数据,在ABC(人工智能、大数据、云计算)里面,数据是个大数据,但是从AlphaGo到AlphaGo Zero(阿尔法元),其实是完成了从大数据到小数据的改进,AlphaGo Zero是没有数据的。
A:这个我不同意。AlphaGo Zero没有数据是说它没有以前真正下过棋的数据,但是有一个东西就是你在下棋,因为你的步还是有限的,游戏是可以自己产生数据的。你其实自己可以假设,任何一步都可能有人下,只是说下这步的人多还是少。所以,今天所有在用游戏做AI的,有一个东西是不公平的,那就是AI可以造数据。在商业行为中,数据可以造,但最后并没有帮助。但是下棋不一样,我刚刚讲了,任何一步都有人下,你不能说那个是假数据,它可以自己造数据。
Q:它是封闭性的。
A:对。
Q:所以下棋是一个例外?
A:对,下棋是一个例外。
Q:它的特点是封闭、规则和博弈。
A:对,所以它自己可以造数据,AlphaGo Zero是自己造数据的。
Q:未来大数据和小数据的结合,计算和悟性的结合这条路怎么走?
A:到底AI以后是更接近人,还是走“大数据和小数据的结合,计算和悟性的结合”这样一条路,我个人更相信后者。
今天的AI叫以繁治繁。左脑和右脑对比,你会发现左脑要用大数据,因为它要分析;右脑是直觉,可以是零数据或者小数据。所以,我们觉得什么人最聪明?是以简治繁。机器是以繁治繁。
下棋就是一个很好的例子,人下棋希望归纳出一些原则,原则越抽象,越好学。机器下棋怪不得会赢,因为它以繁治繁,相当于如果是这样的局势,就走这着;如果是那样的局势,就走那着。我们提到过人记不了这么多东西,所以以繁治繁我们比不过机器,但是以简治繁可以,人类最了不起的叫作“吾道一以贯之”。
大家学物理的话,会知道爱因斯坦为什么提出相对论。因为当年有牛顿力学、量子力学、电磁波,他想找一个定律来解决这些问题,这就是以简治繁,我觉得以简治繁和以繁治繁是互补的,因为世界上很多东西不见得可以以简治繁,物理学家也没有找到一个统一的理论。
Q:左脑和右脑在人的身体上可以沟通和交流,但是AI方面如何呢?
A:AI+HI。
Q:这是一个封闭系统?
A:对。如果不封闭,HI就要引入不封闭的东西,因为人还是可以接触到其他东西的。
Q:您也说了这是一个封闭系统,如果是封闭系统,我们现在面临一个问题,所有的自动化、数字化,结果都是云通过算法、AI、机器学习,不断地自我学习、自我更新、自我发展,人做什么呢?
A:算法都是人做的。
Q:但是算法已经通过深度学习自己来改进了。
A:不,算法还是来自人,深度学习也来自人,而且在里面建模的时候,没有一个系统是没有人的参与的,包括AlphaGo,写算法、写编程的一定是人。
你刚刚讲的封闭系统,它真的可以自己去进化,假设从经济学的角度来看,它的数据分配没有变,就真的可以一直在上面转。但是,有一天如果这个封闭系统变成开放系统,一是一定要搜集新的数据,二是可能还要引进其他算法。
Q:现在AI都是关联性逻辑,而关联性如果能运行得足够好,以至于我们能完全放心,那么是不是可以不走因果关系的逻辑呢?
A:其实也没有。就像我刚刚讲的可预防的维修,“黑盒”告诉你数据和需要预防的维修有关联性,但具体是加油,还是换零件,还是需要技师去现场看一看呢?可能大概是换个零件,换了以后电梯就好了。那么我们就把这个记下来,使得相关数据和这个零件有一个因果关系,测到这样的数据模式时,就去换零件。如果这个理论是对的,事实上就已经找到一个因果关系了,只是靠关联性把这个因果关系运转起来。
所以,今天机器要真正知道怎么去做,还是要有因果关系,否则到底换哪个零件呢?要不然就用穷举法,穷举法也是在做因果关系。想要真正有成效,还是要因果关系,只是这个因果关系较难发现。
Q:无论AI多聪明,还是需要科学家的。
A:是的,还是需要各行的专家。
现场问答
Q:我是清华大学的学生,我在南京AI大会看到沈向洋老师展示了夏语冰(微软小冰),我也去中央美术学院看了夏语冰画的画,它现在基本达到了研究生的水平。我刚才听您说到很多关于绘画、AI这一块的东西,能否请您细致地讲一下,AI是怎样学习绘画技能的,比如印象派等各个流派?
洪小文:就是用大数据去归纳。其实画画本身也是很机械化的,以印象派为例,最早写实派画得跟照片一样,而印象派就是把颗粒变大,但还是保持原来光影的相对性。事实上如果把绘画放到几何里,就是一个机械化的动作,只是我们用人的方法去做那件事情。所以,机器能够画画本身不是一个意外,我觉得难的在于为什么会有这种想法,要去画印象派,甚至到后来的抽象派,我为什么要用这种抽象表示那个意思,我觉得背后有EQ的部分,如果今天搜集了这些数据,我归纳去做也是可以的。
Q:我是多伦多大学计算机系的学生。您对“黑盒”的定义,是说“黑盒”与“白盒”之间是可解释和不可解释的,是一个比较明显的定义。比如人理解问题,你可以用逻辑去解释这个问题。但是比如用深度神经网络去解释,你就说看不懂每一个参数提出来的特征是什么,那么就说这是一个不可解释的“黑盒”系统。但是从这个角度来看,你也不能解释人的大脑里每一个神经元信号的激活代表了什么。您是不是觉得现在我们只是没有找到一个可以好好解释深度学习的方法,还是您觉得它从根本上就不用解释?
朱民:这个问题提得很好,多伦多大学是深度学习的大本营。“黑盒”和“白盒”是确实可以分开的吗?其中的计算过程是怎么完成帮助、转移的?
洪小文:科学家一直在探讨这个问题,脑神经科学家就在探寻你讲的“大脑里每一个神经元信号的激活代表了什么”,在找“白盒”。事实上不管任何学科,都是在找因果关系,只有找到了因果关系,才有可能去做推论。除了贝叶斯定理,今天包括深度学习的几乎所有AI,都在找因果关系。但是大家不要认为“黑盒”是不好的。
《黑匣子思维》一书提出,“黑盒”是不会有偏见的,“白盒”会产生偏见,因为“白盒”还得考虑其他因子,所以人事实上是有偏见的。“不管黑猫、白猫,会抓老鼠的就是好猫”,这句话是一个“黑盒”理论,它是一个很公平的理论。所以,“黑盒”也有“黑盒”的好处,“黑盒”和“白盒”最后还是要混合利用的,也不是说“白盒”就绝对好。
Q:我是北大智能科学系的,也是微软亚洲研究院的实习生,也算是您的员工。我想同时问洪院长和朱院长一个双向的问题,AI作为一个工具,金融行业非常需要AI,如果从朱院长的角度来讲,金融行业对AI最期待的是什么?反过来的话,如果从洪院长的角度,AI对金融行业最大的期待又是什么呢?我感觉这是一个双向的问题。
朱民:他希望我们俩辩论一下。这个问题提得很好,对于金融界来说,最根本的问题还是算法和数据。现在的微贷、中小企业贷款,都是根据数据和算法进行放贷的。算法意味着效率,数据意味着准确和风险控制。现在做理财、做支付、做贷款、做存款、做供求等无数金融交易的案例,核心是对数字结构的理解和算法。而我可以说,到现在为止,AI为金融行业提供的数据和算法还是非常有限的。
举个例子,实际上AI企业、金融科技企业现在对小微企业放贷都无实质性的作用,真正可以提高效率的都是消费贷款,现在只能做到消费贷款这一级别。中小企业贷款的定义是500万~1000万元。10万元以下的消费贷款,AI可以做得非常安全,不良率可以控制到1%以下。蚂蚁金服可以做到“320”——3分钟接受一笔贷款申请,2分钟放款,0人干预,每笔贷款的成本是2.44元,普通银行一般发一笔中小贷款的成本是2400元。但是AI技术就是无法突破10万元线上放款的限制,为什么?答案在于数据、算法。在纯线上的情况下,我们对客户的描述精准性和算法的控制还是达不到要求。所以,归根结底我觉得这个在理论上其实还是有很大期待的。以上是从金融的角度来看这个问题。
洪小文:微软通常都是通过银行、保险等合作伙伴来为金融行业赋能。微软提供的是技术和平台,金融机构有数据,知道背后的商业逻辑,大家合起来做一些事情。比如智能投顾,我们取得的成果包括合作方在内都非常满意。我个人非常同意朱院长讲的,其实有了很多数据以后,就会知道这个人一定还得起,就可以把钱借给他。这个功能的实现,其实大部分的功劳是在数据,而不是在算法。我希望将来金融和AI两者可以深度结合,做一些更普惠的东西,真正帮助到被忽略的群体,同时又能够帮它控制风险,我觉得那是更有意义的。
朱民:AI说到底是一个数据问题,就是对数据的理解,是数据和统计的技术,而计算是第二步。当然,这也可能只是我这个经济学家讲的外行话。
Q:我本人是做投资的,没有学过计算机,但是我对您讲的AI特别关注,因为我们投资了这个方向,最近我们接触的很多行业都是跟AI相关的。想跟您探讨一下,刚才说道,现在AI在智能金字塔还停留在半认知的阶段,但当有一天达到智慧阶段时,算法是不是可能自己会延伸新的算法,而不需要人了?所以未来AI一定会超越人类吗?
洪小文:看来你比较相信奇点理论,但我个人认为非常困难,而且真的有那一天的话,算法它可以主动解问题、证问题,不再需要数学家、物理学家、计算机科学家,我们的世界也不会是现在的样子了。
假如这个世界所有的问题,甚至包括人类从哪里来、将走向哪里,你都知道答案的话,我不确定,但我想那有可能是一个很残酷的世界,甚至结论是我们的世界是某一个外星人做的实验,或者是所有的这些都是一个偶然。
达到奇点理论非常困难,而且实现创造力的算法本身是否真的有一个系统化的做法呢?我们一天到晚希望我们的小孩有创造力,如果有这样的东西,没有人需要学习了,程序会自动帮人类创造、解析问题,那么这个世界已经不是我们今天所了解的世界了。
朱民:这个回答很精彩,这就是智慧,我想快速地总结一下。
第一,AI正在迅猛发展,在智能的金字塔上已经走了一半的路程,现在到了认知阶段,包括理解、洞察、推理、计划、决策,再往上走就是创造阶段了,我们只是不知道它将怎么往前走,“黑盒”和“白盒”之间如何发生转移和融合。小文相信技术一定会往上走,但能否走到最终的奇点,还是超过了今天他的想象,也超过了我的想象,我们不知道。我们相信这一天可能不会到来,因为人还是远远超过机器的,人如果没有这个信心怎么能活到现在呢。我们既对AI有认识,也对它很谦卑,因为我们不知道未来会怎么样,但是它正在如此迅猛地发展。
第二,现有的AI技术已经有无限广阔的应用了,小文举了很多例子——交通、城市、建设、医疗、安全等,这个世界正在被AI的发展不断推向未来,刚才那位提问的投资者充满信心,虽然他不太懂AI,但是会投资很多AI项目。AI在改造我们的世界,使我们身处的场景发生了很大的变化,我不想把它说成一个挑战,我只是说我们都在其中,这是我们的运气。
第三,我们需要改变我们自己,认识到AI正如此汹涌地走向我们,改变世界,我们根本不知道它会走向何处,所以保持谦卑、持续学习,是我们未来最好的方向。
你觉得AI什么时候能实现最高层次的智慧?是50年还是500年?为什么?
回答问题,混沌君在评论区随机挑三位同学送一本《未来已来:全球领袖论天下》。
本书由清华大学国家金融研究院院长朱民主编,集结全球政治、经济、科技等方面领袖人物,从不同角度阐述了他们对未来世界格局全球经济金融格局、AI和5G的技术时代趋势、企业的改革创新等的理解和洞察。
继续阅读
阅读原文