造就Talk | 单霆：为什么无人驾驶会垄断未来

单霆

鹰眼科技创始人兼CEO

我的第一次人工智能方面的创业，发生在十年以前，我创建了全球最早的图片可视化搜索引擎。

2006年我从澳大利亚昆士兰大学博士毕业，然后在澳大利亚国家信息中心NICTA工作。我是一个“非常规”博士，比较能折腾。

我在博士二年级的时候就参与了一个创业项目，把一个人脸识别专利和卧龙岗大学系主任的图搜图专利结合到一起，做了一个图搜图Demo。我还清晰地记得，当时这个Demo是用C#，盗版的Matlab跑的，只能在我自己的笔记本上跑，放到别人的笔记本上还跑不了。

比较幸运的是，在2006年左右，我们从英国独立媒体集团INM（当时世界上仅次于默多克的第二大媒体集团），拿到了400万美金的风险投资。这个数字对于第一轮的投资来说，直到今天都是一个很大的数字，更不要说是在十年以前。

所以当下我就从澳大利亚国家信息中心辞职，放弃一个很稳定、很舒适的工作，从布里斯班搬去了悉尼，创办了Imprezzeo。现在讲起辞职，说得很轻松，但是在那会儿，我是下了一个非常大的决心。

最大的阻力来自我的父母。我的父母是老一辈的知识分子，十年以前的创业环境不像现在这么红红火火，在他们的观念里面，只有找不到工作的人，才会去创业。他们很不能理解，我名校毕业，又是名师弟子，有着很好的工作，为什么要辞职创业？

我的导师再三挽留我，他是世界模式识别协会主席。那时，我是从昆大最快博士毕业的学生，用了两年零八个月，我就完成了博士论文，顺利毕业。所以在他看来，我的职业前景，包括学术前景，都是一条阳光大道，可我偏偏要去走一个独木桥。

当时我的考虑是，07年，我29岁，早上起来坐哪班地铁上班，中午和哪个同事吃饭，下午做哪班地铁回家，几乎是固定的。

周六、周日的日常生活也就是清清前院的草，清清后院的游泳池......

未来30年的生活，我都看得一清二楚。这种生活并非不好，但这肯定不是我想要的那种生活。

最终让我下定决心辞职的，是当时的投资人跟我讲了一句话：你想把你的研究成果一辈子放到学校里边做论文呢，还是说你想去改变世界？

我记得我当时毫不犹豫地回答：我要改变世界。

多年后回过头来看，当真是被人忽悠了，其实老外也是很能忽悠人的。

29岁的我，的确是想去改变世界。我有计算机视觉、模式识别、机器学习等领域的科研成果，我想去做点什么，通过商业化、产业化去改变这个世界。至少为改变这个世界，为改变人们的生活做点什么事儿。

我可以很自豪地说，Imprezzeo是世界上最早给企业市场提供可视化搜索引擎的一家公司。

2010年，Imprezzeo被一家数字管理集团联合几家基金收购。

第一次的创业经历，让我从一个学术人、研究员、科学家，变成了一个创业者、企业人，会从全产业的高度，去看待整个人工智能这样一个行业。

我们同期的其他一些创业公司，像face.com，它是世界上第一家做人脸识别的开放平台，09年被Facebook收购；

like.com是一家可视化购物搜索比价的搜索引擎，被谷歌收购。你今天如果打like.com，将直接跳转到shopping.google.com。

还有Viewdle、瑞典的Polar Rose。Polar Rose的创始人和我还有一些渊源。我们是同一期的博士生，经历也比较相似，之前也有非常多的交流。他们是做3D人脸识别，后来卖给了苹果。

还有比价搜索引擎Snapshot卖给了亚马逊。

我们是最早的一批把图像识别，人工智能技术应用在互联网领域创业的科学家。十年以前的技术和现在相比，还真有点“小米加步枪”的感觉。

无人驾驶汽车？一个更大的坑

身为一个十年之前就开始尝试人工智能创业的科学家，这个行业的从业者，或是人工智能老兵，我有立场说：这其实是一件非常非常苦逼的事。

坦率地说，十年以前我们还不敢说自己是做人工智能的，生怕别人说你不靠谱。就算是现在，我要跟人说我在做人工智能创业，对方一般第一反应是“哇，你好高大上”，但心里面却在说，“行不行?能不能落地？能不能赚钱？”

为什么这么说？

第一，创业的周期非常长。其实我挺羡慕我那些做游戏，做电商的朋友，因为他们变现非常快。反观人工智能创业，没有十年的积累，你在这个市场上是赚不到钱的。

第二，人工智能创业比较难的是，用户期待高，技术有瓶颈。换句话来说，市场非常大的地方，技术其实是有瓶颈的，而技术能解决问题的地方，其实有的时候市场往往不够大，市场和技术之间有一个非常大的gap。

如何去解决？找到一个技术能解决问题，而市场又足够大的方向去创业，是困扰很多人工智能创业者的大问题。但在同时，如果你能找到这个方向，那么恭喜你，你的创业多半会成功。

所以我第二次开始创业的时候，很清楚自己跳入了一个更大的“坑”，我进入自动驾驶领域。

我相信在未来自动驾驶替代司机开车以后，你可以做更多更有意义的事，比抢手机更有意义的事。

我们为什么选择自动驾驶来做第二次人工智能创业的方向？

第一个原因，市场足够大。因为市场在汽车智能化、汽车自动驾驶和无人驾驶上的需求非常大。我记得我第一次做APP是08、09年，那个时候做一个APP就会非常火，这两年你再做一个APP其实很难再火起来，除非你有特别过人之处。

这两年我们经过和做自动驾驶的前装车厂，Tier1的供应商、芯片厂商以及深圳的后装厂商一起合作交流这么多，我们发现，现在的汽车正处在有点像08、09年做手机APP时的感觉，就是从一个功能车往智能车升级换代这样一个过程当中，需求非常非常大。

第二，从安全角度来讲，其实现在我们发生了很多很多的交通事故，并不是因为车本身的原因，而是人的原因。

很多人其实并不遵守交通规则，不该超速的时候超速，不该闯红灯的时候闯红灯，不该加塞的时候加塞，导致安全事故。如果让机器来代替人，用电脑来代替人去开车的话，每个电脑是程序化的，是守规矩的，那将大大降低发生事故的概率。

第三，人工智能这两年的技术，其实处在一个飞跃式的发展阶段。我从02年开始从事人工智能方面的研究和工作。

到现在我看到了几个不同成长的波段，以智能感知模块，以图像识别为例，它的图像识别准确率在几何级般的提升。给无人驾驶、自动驾驶提供了一个非常好的技术支撑。

100万 vs 1万

假如汽车有进化史的话，它可以分为三个阶段。

第一个阶段是高级驾驶辅助阶段，就是我们通常讲的ADAS阶段。汽车仍然由人来控制，但是我们通过摄像头或者雷达，给驾驶员提供包括车道偏移预警，前方碰撞预警等功能。

第二个阶段就是半自动驾驶阶段。如高速跟车这样的场景下，可以由电脑来控制车辆，紧急情况下才从电脑操控改为司机操控。

第三个阶段就是我们未来的全自动驾驶阶段。无人驾驶阶段，汽车完全交由电脑来控制。主要的技术路线有两种，第一种就是一步到位型，利用激光雷达为主要传感器，代表的比如说像谷歌之类的公司。

它们采取激光雷达配合高精度地图的方式，采取一步到位来做无人驾驶，但是这种方式存在一个问题，就是传感器昂贵，成本非常高。

在谷歌汽车顶上的这套激光雷达成本至少在100万人民币以上，很多时候传感器本身比车都贵。

我们所采取的这种方式叫做循序渐进型，最大的优势就是成本非常便宜，开车基本靠“算”。

我们利用低成本传感器，比如毫米波雷达，超声波雷达以及光学摄像头，配合我们的人工智能的算法，实现这种半自动驾驶或者自动驾驶。

靠“算”的意思就是说我们要更依靠人工智能方面这种算法的准确性。

下面我稍微简单介绍一下我们这样一个技术的解决方案。

大家看到的在红圈这部分是超声波雷达，因为它有效距离最短，我们可以起到360度环视以及自动泊车的一个功能。

光学摄像头，我们会利用普通的光学摄像头进行交通信号识别，中距离碰撞预警，自动大灯控制，车道识别等功能。

此外还有一个盲区预警，变道危险预警，以及360度环视后方碰撞预警这样的一些功能。我们利用的传感器就是毫米波雷达，我们会进行远距离的碰撞预警，以及自适应巡航。此外我们还会配合高精度地图。

这个方案的好处在于，第一，成本非常低，可能你的摄像头成本只有一两百块，几百块人民币左右。

第二，为什么人可以在开车的时候，自如地、安全地做出很多指令或者控制呢？因为你能看到。人有眼睛，眼睛传给大脑，可以做出很多这样的判断。

光学摄像头在汽车里面也起到了汽车的眼睛这样的作用，它一定要实时地感知自己所处的环境。大家可以看到，这是我们的一个智能感知模块现在所做的一些工作。

红色框是车辆检测的结果，黄色框是行人检测的结果。蓝色线是我们的车道保持，车道线识别的结果。

可以看一下我们一个视频。这个是在广州的一个闹市，我们随意拍下来的一个视频。这是一个非常嘈杂，非常热闹的环境。有的时候我们也开玩笑讲，能够在中国做到自动驾驶，在全世界都没什么问题了。因为中国是司机开车自由度最高的国家。

包括各个角度的车辆，包括遮挡的车辆，包括遮挡的行人，我们都能做到非常好的检测识别，真正做成像汽车的眼睛一样。其实也是我们公司的命名所来，慧眼科技，就是说智慧的眼睛，汽车的智慧的眼睛。

大家想问了，你们为什么敢和谷歌这样的大科技公司竞争？这样的一个领域非常烧钱，需要很大的资金投入，为什么有这个信心呢？我们的信心来自于这儿。我列了一个数字，谷歌高精度激光雷达成本至少在100万人民币。

那我们的成本呢？1万块人民币。相差了100倍，而且我认为哪怕在未来的三年之内，不会有人去为一个自动驾驶的功能花100万，但是一万块，很多人可能会加装这样的一个功能。这是我们敢去和这种科技巨头去PK，去竞争同一个领域的信心所在。

大家必然要问，你敢开吗？敢上路吗？老老实实地讲，我自己不敢开上闹市的。用我们的方案，我不会开着我们的车进到闹市，包括谷歌的车我也不敢进到闹市，尤其我们利用低成本传感器这种方案。

坦率地讲，高成本的、高精度地图加上激光雷达这种方案，它的优势在于准确，准确性非常高。但是它的劣势在于成本高。

那么通过我们的技术路线通过各种低成本传感器，比如说像雷达加光学摄像头这种方向，成本低廉，相对的准确性也就没有激光雷达那么高。

2017年将会是巨大爆发点

我们不懈努力的，就是不断地提高人工智能算法。实际上，我们的技术水平已经达到了可以商用化的地步。

在图像识别准确率，以及雷达识别准确率保障基础之上，我们会选择一些结构化的场景，简单的、低速的、路线固定的一些场景作为我们无人驾驶车落地的场景。

比如高尔夫球车。在高尔夫球场，场景其实是非常简单，障碍物非常少。车开得很低速。大不了，智能算法没有那么的精准。前面说有棵树，直接冲着树去了，我们可以放一个按钮，你可以随时按按钮刹车。还有园区巡逻车诸如此类的一些场景。

中国原来是个自行车大国，现在变成了一个汽车大国。保有量在1.5亿辆，而且每年按照2500万辆新增汽车这样的一个增长水平，在不断地刷新车辆的数量。

但是每年全世界120万人因为人为开车而丧失自己的性命，这其实是一个非常恐怖的数字，其中93%是由于人为操作不当而引起的。

引入了无人驾驶的未来，我们会把出事故率降低90%，也就是说从120万会降低到12万，大家可以想一想可以拯救多少条性命，可以挽救多少个家庭。

对未来，包括智能汽车，包括自动驾驶，我们的判断是这样的：

2017年，也就是明年，车联网、汽车智能化会有一个全面爆发。我们跟很多车厂，包括后装的厂商聊下来，大致得到这样一个共识：汽车在今年和明年，就已经要开始变成一个在路上跑的”手机”。越来越多的汽车会联网。

2018年会实现非常多的车普及半自动驾驶。所谓半自动驾驶，就是通过雷达和光学摄像头来帮助你控制汽车，目前高档车上有，但是在2018年，也就是两年以后，我们很多国产车、中低档车都会配备这样的功能，会逐渐变成一种标配。

另外，特定场景下的自动驾驶也会普及。就是我刚才讲的类似于低速、场景固定的，路线固定的，场景简单结构化的自动驾驶会普及。

2026年，也就是十年以后，自动驾驶会实现全面普及。

做了数十年的人工智能，我觉得人工智能技术其实和我们人生非常相似，借用某一句广告词：Impossible is nothing。

人工智能技术发展，没有什么不可能；同样，我们的人生也没有不可能。

谢谢大家。

Misa.Z | 是什么撕开了人和机器的边界？

陈霖 | 是什么让我们衰老？

田沁鑫 | 中国为什么出不了星球大战这样的超级IP？

简里里 | 我们为什么觉得孤独

王健 | 以“我”为中心的世界

马家辉 | 我们生活在一个没有遗忘权利的时代

苑明理 | 用虚拟的星球，反省我们的世界观

点击标题查看往期回顾

继续阅读

阅读原文