如果将计算机学习比喻成人工智能的骨架与肌肉,那么大数据就是流淌在这副身体内的血液。
车品觉是谁?
他是红杉资本中国基金专家合伙人,前阿里巴巴集团副总裁、数据委员会会长。
他是国内大数据实践的先行者、数据观察家,拥有十几年丰富的数据实战经验,并在实践中形成了独特的数据化思考方式,对电子商务未来趋势有独到见解。
在他看来,未来没有一个国家不是数据国家,未来没有一家公司不是数据公司,未来没有一个人不是机器人。
造就日前对车品觉进行了专访,内容涉及人工智能与大数据的关系、数据与算法优先级、人工智能的适应性、机器情感、数据壁垒、人类与智能物件碰撞、未来大数据的价值等等话题。
车品觉认为,虽然数据非常重要,无数据不成活,(传送门 | 车品觉:无数据不成活)但数据并不是一切。只有自利及利他的数据,才能让这个世界变得更美好。
造小就编辑后的访谈内容节选如下:
造就:为什么说做好人工智能的基础是做好大数据?
车品觉:其实,二十年前已经有人工智能了,但直到这两年人工智能才开始爆发,为什么?那是因为以往并没有足够多的数据。如果一件事只发生了一次,你根本不可能从中提取到足够多的东西;但如果同一件事情出现了一百万次,那一百万次里所发生的种种,就会成为人工智能的一个数据源。
今天我们讲的人工智能跟以往谈论的不一样。人工智能在进步,大数据也在进步。大数据的进步又反过来推动着人工智能发展。以往不敢做、不能做的人工智能,譬如Alpha Go、人机互动、客服机器人等等,现在因为有了足够多的数据,都可以实现了。
造就:数据比算法更重要吗?
车品觉:讨论数据比算法更重要,需从不同的场景去分析。这是因为,数据乃今天所有数据应用的原料。如果没有原料(数据),有工具(算法)又有什么用呢?这就好比是巧妇难为无米之炊;算法也需要数据来支撑。
当大家都有对等的数据时,才能充分展现出算法的优势来。这其中,没有谁比谁重要。尽管现在有很多的算法,看起来Alpha Go很厉害,但其实不需要两年,所有人都能够学会这个算法。
造就:未来的数据壁垒会是什么?数据可以被锁定吗?
车品觉:我觉得将来的壁垒首先来自于数据的差异。我有这个数据而你没有,你只能用别的可能没那么好的材料。另一个壁垒是,当用户使用了你的数据产品,他的数据会回流回来。
所以说这种数据是活的。要锁定这种数据,一是需要这个资源只为你独家使用;另外需要在场景上对用户产生粘性,让每个人都重复使用你的场景。
只有拥有场景的人,才能拥有这个数据。就像滴滴拥有很多人的地理位置数据,WIFI万能钥匙拥有很多wifi数据。这些数据的可爱之处在于,虽然你能够锁定它们,但它们也在不断地产生新的数据,因此你并不知道自己能锁定多少个渠道。
我想重申,一方面数据可以锁定使用权,但另一方面也有更多新的数据在生成。说白了,数据产生于场景,没有一个数据不是在场景里发生的。
造就:怎么定义场景?为什么我们不直接叫它应用,反而要叫场景呢?
车品觉:场景即应用。地图是一个应用,有地图就会有地点位置,所以它是一个场景。你可以想像,只要有一个新场景出现,自然有一个新的数据出现。而且这个新的数据,必然也会成为一个能去帮助别的应用的数据。
之所以称它为应用,是因为应用比较容易理解。场景更多讲的是一个环境,但是应用就是一个应用。你不会说高德地图是一个场景,你肯定说它是一个应用。
什么是场景呢?我认为是这样的:当有一个人,他很想从A点到B点,到底怎么样可以最快到达,那是一个场景。当这种场景出现时,我们若能用数据的方法去解决其中的问题,那就是应用了。
造就:未来大数据的价值在于解决问题?数据如何定义人工智能的未来进化?
车品觉
:是的,所有数据的出口都在于解决问题。很多人问我,从事大数据研究的这六年里,感受到的大数据的最大变化是什么?

以前,我们做的应用其实是在支持人类解决问题,但并不是把解决问题看成整体,去自动化的解决。目前我们看见的很多人工智能的场景或应用,大部分都希望我们可以自动化地把问题解决,中间不需要人的参与。
数据、算法与应用的关系非常重要。当没有人参与的时候,应用会变得非常难有“适应力”。而人是很有适应力的,假使一个报告里面有错误的句子,人还可以去理解这个报告;但是如果是一个机器去读这个有错误的报告,它就没办法适应,不大能领悟报告的真正涵义。
我认为,未来整个人工智能的进步点在于,它可否有人的适应能力。这个适应能力,不仅包括错误,还包括整个场景里环境的变化。变化对人来说,是一件很自然的事情;但对一个机器人来讲,它就觉得很不自然。
如果我们的AI(人工智能)是进步的,它的适应能力应该会更强。同时,这个适应力也跟大数据有关。今天,整个大数据和AI的准确度来自于有足够多的案例。
造就:可以预见物联网会带来极大的数据量爆发,我们该如何去看这些数据?
车品觉:因为物联网将很多人的行为搬到了线下,所以你有了数据。其实是人的行为改变了物品,如果他们的行为不改变,不愿意接受物联网,那么今天的很多数据还是滞留在线下。
如今,互联网已经很容易被接受,加之受众的年龄逐渐年轻化(90后、00后),他们基本上每天要在物联网里做很多东西,这些数据积累下来会变得很惊人。在这种情况下,我们发现,以往没有的数据都慢慢地呈现出来,这些都是在不断扩大的资源。
我们假定,数据在场景里出现的速度比一般人想像得要快。你不能想像的某件事,可能已在某个角落出现,数据积累已经开始,这是从事大数据研究的圈内人非常基本的共识。
造就:未来机器和人又会以什么样的方式产生数据?
车品觉:前面我谈到过适应力,适应力低的机器需要更高的准确度。现在我们可以把某样东西的精确度从90%提高到95%,其中一个例子是刷脸。
在两年前,刷脸还被认为是一个很高级的技术,但现在刷脸的准确度可以达到90%,很多银行、支付宝都觉得可以使用这个技术。因为这还只是一个辅助的工具,并不仅仅依靠刷脸进行支付。
通过知道你的公司位置+刷脸,准确度可以提升到95%,我知道你肯定不是骗子了。一个应用的精确度越高,它的重要性也会越高。我们要找好数据和人工智能之间的匹配,用数据提升应用的精确度。
最近有一个新的名词出现,叫做“智能物件”。只要一件物体能连上互联网,它就是物联网的一部分。现在只要使用了更多的智能物件,这种智能的物件跟物联网产生一个网络,它会跟所有其他的物件沟通,以服务你。
未来世界的物件,会有点像今天的iPhone,物件本身不仅仅把信息发出去,它还具备智能的能力。这种智能的能力,也会产生数据。那时,每一个物件都能跟物联网、大数据进行交互。
造就:智能物件的数据会产生一个爆发?
车品觉:没有这么简单。如果我们讲的不是应用,而是这个世界里所有的物件,基本上是收集数据跟互动数据的一个客体,这样的数据量当然会很多。但是我觉得产生的量多,不能代表智能物件的数据,这需要它懂得判断这个世界上其他地方出现的问题引发了自己的互动。
同一个场景中的所有物件在沟通,每一个物件都在不断循环地产生数据、适应环境,为你所用。这样的智能物件跟人的思维和行为改变有关,这样的数据被收集起来后,可以帮助你处理一些以往想都不敢想能够处理的问题。
举个例子,冰箱里面有苹果汁、可乐、矿泉水,智能物件觉得你要倒一杯东西喝,智能杯子会通知你手上的手表,是时候要喝一杯东西了。你一看是呀,它继续跟你说,“你到冰箱里面拿苹果汁喝”。这些智能物件互相互动为你服务。
造就:这是否意味着未来物联网普及之后,人类跟智能物件会有更多的碰撞?
车品觉:这里面会有非常多的碰撞。物与物的碰撞、人与人的碰撞,或者互相关联,会产生另外一个非常大的大数据。这个非常大的大数据有可能给人工智能用,有可能给智能物件用,当然也有可能给你用。
所以将来人类到底怎么样跟它身边的每一个智能物件去沟通?今天我们手上拿着一个智能物件——手机。但是未来你会发现,我们身边的很多东西都是智能互动的一部分。手机、手表、眼镜、沙发等等,它们不断地自调节是为了一个目标,所以设定目标非常重要。
你身边的所有东西,都可以帮你执行目标。当然你还可以找个机器人帮你设定一个更好地目标,这里面有一点我觉得蛮恐怖,就是人类没有差异化了。
你会发现,广告平台能够赚到的钱越来越少,因为每个人都能很精准地找到自己的目标用户,整个生态发生改变。这时候是需要有艺术感、差异化的广告。所以我一直都认为,今天的大数据有很多很好的效果,也不要高兴得太早。目前有很多人在使用大数据,这是一个很容易摘的果子。
我师父教过我一句很重要的话,“让人做人能做得最好的东西,让机器做机器能做得最好的东西。”这是未来的一个新的平衡点,但是今天还有很多人没有理解到,其实有些东西确实不应该自己做了,让机器去做吧。
公司与公司之间的竞争也是如此,要快点知道到底一个公司的人力应该更多地放在哪里,不放在哪里。我觉得越早感受到这个边界的公司,有可能越早把其他的公司淘汰掉。
造就:数据会让机器产生情感吗?
车品觉:我觉得这个问题首先应该讨论什么叫情感?假的情感是情感吗?如果你觉得假的情感不是情感,那我觉得不对。
人类要一个机器笑,它就对着你笑,你觉得太假了。当你觉得这个笑太假的时候,你根本不会认为这个是真情感。
造就:所以你认为什么是人工智能?
车品觉:还是那句话,人工智能的定义是什么?是用机器模仿人,所以有人现在提出“智能人工(intellegence artificial)”的概念, 这个词的本身就是这个意思——模仿的智能。
造就:大数据跟人工智能不是一回事。大数据是一个点,而人工智能是上面的一种应用方式。这个说法对吗?
车品觉:对,而且将来有可能会有一种工具超越人工智能。但是我相信,将来不会有东西超越大数据。
因为大数据本来就不是一个方法论,不是一个工具,大数据是数据的战略。我们每个人都要积累有用的数据、核心的数据,要变得更敏锐。尤其是管理者和企业家需要了解数据。
造就:你为什么这么喜欢数据?
车品觉:我之所以这么喜欢数据,因为它的力量不是我们前面所应用的地方能去比的。当它能够流动的时候,产生出来的价值也不是以往的东西能够增加的。
同时,我们也知道数据的漏洞会产生非常多社会、伦理等方面的问题,数据也不是完全一片光明美好的。
这个社会要去平衡数据的使用。既要有更多可用的数据,又不能伤害某个体、某公司。怎么做到既分享数据,同时又保障数据使用的安全?我觉得这是一个新的课题。

车品觉为7月8日“造就未来大会”之《主动进化》主题演讲的圆桌对话嘉宾,如果您想探知更多车品觉的观点,欢迎关注本期造就大会。
点击下方图片或“阅读原文”
立即购票
继续阅读
阅读原文