单霆
鹰眼科技创始人兼CEO
我的第一次人工智能方面的创业,发生在十年以前,我创建了全球最早的图片可视化搜索引擎。
2006年我从澳大利亚昆士兰大学博士毕业,然后在澳大利亚国家信息中心NICTA工作。我是一个“非常规”博士,比较能折腾。
我在博士二年级的时候就参与了一个创业项目,把一个人脸识别专利和卧龙岗大学系主任的图搜图专利结合到一起,做了一个图搜图Demo。我还清晰地记得,当时这个Demo是用C#,盗版的Matlab跑的,只能在我自己的笔记本上跑,放到别人的笔记本上还跑不了。
比较幸运的是,在2006年左右,我们从英国独立媒体集团INM(当时世界上仅次于默多克的第二大媒体集团),拿到了400万美金的风险投资。这个数字对于第一轮的投资来说,直到今天都是一个很大的数字,更不要说是在十年以前。
所以当下我就从澳大利亚国家信息中心辞职,放弃一个很稳定、很舒适的工作,从布里斯班搬去了悉尼,创办了Imprezzeo。现在讲起辞职,说得很轻松,但是在那会儿,我是下了一个非常大的决心。
最大的阻力来自我的父母。我的父母是老一辈的知识分子,十年以前的创业环境不像现在这么红红火火,在他们的观念里面,只有找不到工作的人,才会去创业。他们很不能理解,我名校毕业,又是名师弟子,有着很好的工作,为什么要辞职创业?
我的导师再三挽留我,他是世界模式识别协会主席。那时,我是从昆大最快博士毕业的学生,用了两年零八个月,我就完成了博士论文,顺利毕业。所以在他看来,我的职业前景,包括学术前景,都是一条阳光大道,可我偏偏要去走一个独木桥。

当时我的考虑是,07年,我29岁,早上起来坐哪班地铁上班,中午和哪个同事吃饭,下午做哪班地铁回家,几乎是固定的。
周六、周日的日常生活也就是清清前院的草,清清后院的游泳池......
未来30年的生活,我都看得一清二楚。这种生活并非不好,但这肯定不是我想要的那种生活。
最终让我下定决心辞职的,是当时的投资人跟我讲了一句话:你想把你的研究成果一辈子放到学校里边做论文呢,还是说你想去改变世界?

我记得我当时毫不犹豫地回答:我要改变世界。
多年后回过头来看,当真是被人忽悠了,其实老外也是很能忽悠人的。
29岁的我,的确是想去改变世界。我有计算机视觉、模式识别、机器学习等领域的科研成果,我想去做点什么,通过商业化、产业化去改变这个世界。至少为改变这个世界,为改变人们的生活做点什么事儿。
我可以很自豪地说,Imprezzeo是世界上最早给企业市场提供可视化搜索引擎的一家公司。
2010年,Imprezzeo被一家数字管理集团联合几家基金收购。

第一次的创业经历,让我从一个学术人、研究员、科学家,变成了一个创业者、企业人,会从全产业的高度,去看待整个人工智能这样一个行业。
我们同期的其他一些创业公司,像face.com,它是世界上第一家做人脸识别的开放平台,09年被Facebook收购;

like.com是一家可视化购物搜索比价的搜索引擎,被谷歌收购。你今天如果打like.com,将直接跳转到shopping.google.com。
还有Viewdle、瑞典的Polar Rose。Polar Rose的创始人和我还有一些渊源。我们是同一期的博士生,经历也比较相似,之前也有非常多的交流。他们是做3D人脸识别,后来卖给了苹果。
还有比价搜索引擎Snapshot卖给了亚马逊。
我们是最早的一批把图像识别,人工智能技术应用在互联网领域创业的科学家。十年以前的技术和现在相比,还真有点“小米加步枪”的感觉。
无人驾驶汽车?一个更大的坑

身为一个十年之前就开始尝试人工智能创业的科学家,这个行业的从业者,或是人工智能老兵,我有立场说:这其实是一件非常非常苦逼的事。
坦率地说,十年以前我们还不敢说自己是做人工智能的,生怕别人说你不靠谱。就算是现在,我要跟人说我在做人工智能创业,对方一般第一反应是“哇,你好高大上”,但心里面却在说,“行不行?能不能落地?能不能赚钱?”
为什么这么说?

第一,创业的周期非常长。其实我挺羡慕我那些做游戏,做电商的朋友,因为他们变现非常快。反观人工智能创业,没有十年的积累,你在这个市场上是赚不到钱的。
第二,人工智能创业比较难的是,用户期待高,技术有瓶颈。换句话来说,市场非常大的地方,技术其实是有瓶颈的,而技术能解决问题的地方,其实有的时候市场往往不够大,市场和技术之间有一个非常大的gap。
如何去解决?找到一个技术能解决问题,而市场又足够大的方向去创业,是困扰很多人工智能创业者的大问题。但在同时,如果你能找到这个方向,那么恭喜你,你的创业多半会成功。
所以我第二次开始创业的时候,很清楚自己跳入了一个更大的“坑”,我进入自动驾驶领域。
我相信在未来自动驾驶替代司机开车以后,你可以做更多更有意义的事,比抢手机更有意义的事。
我们为什么选择自动驾驶来做第二次人工智能创业的方向?
第一个原因,市场足够大。因为市场在汽车智能化、汽车自动驾驶和无人驾驶上的需求非常大。我记得我第一次做APP是08、09年,那个时候做一个APP就会非常火,这两年你再做一个APP其实很难再火起来,除非你有特别过人之处。
这两年我们经过和做自动驾驶的前装车厂,Tier1的供应商、芯片厂商以及深圳的后装厂商一起合作交流这么多,我们发现,现在的汽车正处在有点像08、09年做手机APP时的感觉,就是从一个功能车往智能车升级换代这样一个过程当中,需求非常非常大。

第二,从安全角度来讲,其实现在我们发生了很多很多的交通事故,并不是因为车本身的原因,而是人的原因。
很多人其实并不遵守交通规则,不该超速的时候超速,不该闯红灯的时候闯红灯,不该加塞的时候加塞,导致安全事故。如果让机器来代替人,用电脑来代替人去开车的话,每个电脑是程序化的,是守规矩的,那将大大降低发生事故的概率。
第三,人工智能这两年的技术,其实处在一个飞跃式的发展阶段。我从02年开始从事人工智能方面的研究和工作。
到现在我看到了几个不同成长的波段,以智能感知模块,以图像识别为例,它的图像识别准确率在几何级般的提升。给无人驾驶、自动驾驶提供了一个非常好的技术支撑。
100万 vs 1万


假如汽车有进化史的话,它可以分为三个阶段。
第一个阶段是高级驾驶辅助阶段,就是我们通常讲的ADAS阶段。汽车仍然由人来控制,但是我们通过摄像头或者雷达,给驾驶员提供包括车道偏移预警,前方碰撞预警等功能。
第二个阶段就是半自动驾驶阶段。如高速跟车这样的场景下,可以由电脑来控制车辆,紧急情况下才从电脑操控改为司机操控。
第三个阶段就是我们未来的全自动驾驶阶段。无人驾驶阶段,汽车完全交由电脑来控制。主要的技术路线有两种,第一种就是一步到位型,利用激光雷达为主要传感器,代表的比如说像谷歌之类的公司。
它们采取激光雷达配合高精度地图的方式,采取一步到位来做无人驾驶,但是这种方式存在一个问题,就是传感器昂贵,成本非常高。
在谷歌汽车顶上的这套激光雷达成本至少在100万人民币以上,很多时候传感器本身比车都贵。
我们所采取的这种方式叫做循序渐进型,最大的优势就是成本非常便宜,开车基本靠“算”。
我们利用低成本传感器,比如毫米波雷达,超声波雷达以及光学摄像头,配合我们的人工智能的算法,实现这种半自动驾驶或者自动驾驶。
靠“算”的意思就是说我们要更依靠人工智能方面这种算法的准确性。
下面我稍微简单介绍一下我们这样一个技术的解决方案。

大家看到的在红圈这部分是超声波雷达,因为它有效距离最短,我们可以起到360度环视以及自动泊车的一个功能。
光学摄像头,我们会利用普通的光学摄像头进行交通信号识别,中距离碰撞预警,自动大灯控制,车道识别等功能。
此外还有一个盲区预警,变道危险预警,以及360度环视后方碰撞预警这样的一些功能。我们利用的传感器就是毫米波雷达,我们会进行远距离的碰撞预警,以及自适应巡航。此外我们还会配合高精度地图。
这个方案的好处在于,第一,成本非常低,可能你的摄像头成本只有一两百块,几百块人民币左右。
第二,为什么人可以在开车的时候,自如地、安全地做出很多指令或者控制呢?因为你能看到。人有眼睛,眼睛传给大脑,可以做出很多这样的判断。
光学摄像头在汽车里面也起到了汽车的眼睛这样的作用,它一定要实时地感知自己所处的环境。大家可以看到,这是我们的一个智能感知模块现在所做的一些工作。
红色框是车辆检测的结果,黄色框是行人检测的结果。蓝色线是我们的车道保持,车道线识别的结果。

可以看一下我们一个视频。这个是在广州的一个闹市,我们随意拍下来的一个视频。这是一个非常嘈杂,非常热闹的环境。有的时候我们也开玩笑讲,能够在中国做到自动驾驶,在全世界都没什么问题了。因为中国是司机开车自由度最高的国家。
包括各个角度的车辆,包括遮挡的车辆,包括遮挡的行人,我们都能做到非常好的检测识别,真正做成像汽车的眼睛一样。其实也是我们公司的命名所来,慧眼科技,就是说智慧的眼睛,汽车的智慧的眼睛。
大家想问了,你们为什么敢和谷歌这样的大科技公司竞争?这样的一个领域非常烧钱,需要很大的资金投入,为什么有这个信心呢?我们的信心来自于这儿。我列了一个数字,谷歌高精度激光雷达成本至少在100万人民币。
那我们的成本呢?1万块人民币。相差了100倍,而且我认为哪怕在未来的三年之内,不会有人去为一个自动驾驶的功能花100万,但是一万块,很多人可能会加装这样的一个功能。这是我们敢去和这种科技巨头去PK,去竞争同一个领域的信心所在。
大家必然要问,你敢开吗?敢上路吗?老老实实地讲,我自己不敢开上闹市的。用我们的方案,我不会开着我们的车进到闹市,包括谷歌的车我也不敢进到闹市,尤其我们利用低成本传感器这种方案。
坦率地讲,高成本的、高精度地图加上激光雷达这种方案,它的优势在于准确,准确性非常高。但是它的劣势在于成本高。
那么通过我们的技术路线通过各种低成本传感器,比如说像雷达加光学摄像头这种方向,成本低廉,相对的准确性也就没有激光雷达那么高。
2017年将会是巨大爆发点
我们不懈努力的,就是不断地提高人工智能算法。实际上,我们的技术水平已经达到了可以商用化的地步。
在图像识别准确率,以及雷达识别准确率保障基础之上,我们会选择一些结构化的场景,简单的、低速的、路线固定的一些场景作为我们无人驾驶车落地的场景。
比如高尔夫球车。在高尔夫球场,场景其实是非常简单,障碍物非常少。车开得很低速。大不了,智能算法没有那么的精准。前面说有棵树,直接冲着树去了,我们可以放一个按钮,你可以随时按按钮刹车。还有园区巡逻车诸如此类的一些场景。
中国原来是个自行车大国,现在变成了一个汽车大国。保有量在1.5亿辆,而且每年按照2500万辆新增汽车这样的一个增长水平,在不断地刷新车辆的数量。
但是每年全世界120万人因为人为开车而丧失自己的性命,这其实是一个非常恐怖的数字,其中93%是由于人为操作不当而引起的。
引入了无人驾驶的未来,我们会把出事故率降低90%,也就是说从120万会降低到12万,大家可以想一想可以拯救多少条性命,可以挽救多少个家庭。
对未来,包括智能汽车,包括自动驾驶,我们的判断是这样的:
2017年,也就是明年,车联网、汽车智能化会有一个全面爆发。我们跟很多车厂,包括后装的厂商聊下来,大致得到这样一个共识:汽车在今年和明年,就已经要开始变成一个在路上跑的”手机”。越来越多的汽车会联网。
2018年会实现非常多的车普及半自动驾驶。所谓半自动驾驶,就是通过雷达和光学摄像头来帮助你控制汽车,目前高档车上有,但是在2018年,也就是两年以后,我们很多国产车、中低档车都会配备这样的功能,会逐渐变成一种标配。
另外,特定场景下的自动驾驶也会普及。就是我刚才讲的类似于低速、场景固定的,路线固定的,场景简单结构化的自动驾驶会普及。
2026年,也就是十年以后,自动驾驶会实现全面普及。
做了数十年的人工智能,我觉得人工智能技术其实和我们人生非常相似,借用某一句广告词:Impossible is nothing。
人工智能技术发展,没有什么不可能;同样,我们的人生也没有不可能。
谢谢大家。


点击标题 查看往期回顾

继续阅读
阅读原文