他是图形识别的科学家,在国际顶级期刊上发表了40多篇论文。他更是企业家,短短3年时间,带领企业从一个高峰走向另外一个高峰,并迅速成为行业第一,估值达到300亿。他就是商汤科技的联合创始人徐立。
一、五岳归来不看山
徐立从小就聪颖过人,7个月开始咿咿呀呀学语,4岁已经能够背诵三字经。“聪明早说话,富贵迟生牙”,虹桥附近的很多老人都预言徐立将来一定会有出息。
从小学5年级开始,徐立开始迷上金庸的武侠小说。
刚开始是《射雕英雄传》,后来是《神雕侠侣》、《天龙八部》、《书剑恩仇录》。整个初中3年,上海图书馆金庸的15部小说都被他借了个遍,《射雕英雄传》更是看了足足三遍。
徐立由此养成了过目不忘的本事。就在同龄孩子还在为鸡兔同笼的题目发愁时,他已经熟读阿贝尔定理、格林公式,并对费马大猜想、四色猜想、哥德巴赫猜想跃跃欲试。
整个高中3年,徐立多次代表复旦附中参加上海市中小学数学奥林匹克竞赛,数次获得金牌。
正是得益于此,2000年,18岁的徐立被保送至上海交大计算机系就读本科,4年后他又一次被保送硕博连读,可以说风光无限。
而且,以上海交大计算机博士的履历,找个上流的工作是不成问题的。
果然,毕业后,徐立先后在摩托罗拉、欧姆龙、联想研究院、微软研究院等机构工作,从事计算机视觉、模式识别、图像处理领域的研究和产品开发,待遇也是一家比一家高,最高年薪达到50万。
但是,徐立并不满足,因为那三年正是大数据、云计算、人工智能高速发展的3年。一个标志性的消息就是Facebook以高达1亿美元的价格,收购了以色列一家成立不满一年的人脸识别公司。

深度学习是未来的方向,人脸识别大有可为!

但是,华山以外,很难论出好剑。
人脸识别技术哪里最强?当然是香港中文大学的多媒体实验室。要知道,该实验室与麻省理工、斯坦福等一道入选2010年世界“十大人工智能先锋实验室”。
于是,2010年秋天,徐立毅然决然放弃一切工作,只身前往香港中文做博士后。从此,徐立将自己的命运紧紧地与人脸识别,与汤晓鸥教授连在了一起。
二、泰山归来不看岳
汤晓鸥是谁?麻省理工的博士,香港中文大学教授,曾参与筹备微软亚洲研究院,国家“千人计划”入选者,全球人脸识别技术的探路者。 
正是在汤晓鸥老师的悉心指导下,徐立图形识别的功力大涨,其研发的3个算法获得了国际最知名视觉开源平台的收录,还有一篇论文为图形学期刊TOG 论文引用世界第一。
不过,当时的图形识别还处于实验室阶段。毫不夸张地说,当时汤晓鸥的实验室完全是捧着金饭碗要饭,五年间最大的一笔收入就是几十万港币,那是一个来自香港警方的项目,“帮忙从模糊的监控录像中找出逃逸车辆,恢复出逃车辆的信息。”
校园无甲子,寒暑又一年。
等到2014年春天,以深度学习为代表的人工智能一下子火爆起来,仅仅智能语音入口,谷歌、苹果、腾讯、百度、阿里等巨头就砸进去几百个亿。
另一个入口就是视觉识别。2014年Google耗资4亿英镑收购只有12位员工的Deep Mind。要知道,那公司一共才12名员工,没有具体产品,只有从事深度学习的游戏研究!
首先嗅到机会的是IDG的牛奎光。当他发现2011年至2013年期间,全球计算机视觉ICCV/CVPR顶级会议中,深度学习领域有29篇顶级论文,香港中文的汤晓鸥团队就占了14篇,他完全震惊了!
“走过,路过,绝对不能错过!”
此后,正是在香港中文,牛奎光一下子看到了五、六个计算机识别技术的模型展示,“全是底层算法的突破”。
而且,徐立的一句话瞬间击中了他,“大部分公司做的都是如何训练‘猫脑’更完美地抓老鼠,而我们的兴奋点则是把‘猫脑’训练成‘猴脑’!”
“太好了,投!”而且一投就是数千万美元!
团队?当然不是事。听说汤教授要成立公司,哗啦啦从实验室涌过来50多个学生,全部是博士、博士后。一年以后,汤晓鸥干脆让徐立把华人圈里能够找到的图形识别的博士生全招了进来。
很快,以汤晓鸥、徐立为核心的联合创始人团队组建了起来。
徐冰,香港中文大学博士,联合创始人,副总裁。
杨帆,清华硕士,拥有13项发明,联合创始人兼北京分公司总经理
王晓刚,麻省理工博士,硕士阶段就发表了五篇TOP5的论文,联合创始人兼商汤研究院院长
邱石,香港中文大学博士,清华大学本科,联合创始人
不过,深度学习取决于三大要素,“一是造脑能力,二是计算能力,三是大数据。”
造脑能力徐立不担心,因为他不是一个人在战斗。
在多媒体实验室,还有许多异常聪明的大脑。那段时间,汤晓鸥师徒50多人偏距在校园一隅,每天要做的工作就是默默地思索如何构建算法平台。
徐立最担心的是计算能力。要知道,当时百度已经构建了当时世界最快的超算平台,实现144个GPU连接,而商汤起步的时候,一个GPU都没有,计算结果往往要等1个月才能验证。
关键时候,汤晓鸥的金字招牌+IDG的上千万美元起了作用。
事实上,仅仅一年后,商汤超算平台就实现了200块GPU的连接2年后,一个全中国最大的深度学习超算中心在商汤科技拔地而起,拥有超过 8000 块 GPU以前耗时1个月的运算,如今只需5-6个分钟即可完成。
三、一炮走红
不过,就在徐立苦练内功的时候,美国的Facebook也没有闲着,扎克伯克的野心是要做第一个打破工业级红线的人,“让计算机识别准确度超越人眼准确度。”
差距显而易见。当时Facebook已经用750万人的数据对计算机进行训练,其人脸识别准确率非常接近人眼识别能力。而此时徐立把吃奶的力气都使了出来,也才建立起20万人的数据库。
怎么办?
“只能赢不能输,Facebook是开源的,如果没有能赢过他们,就不能说服别人放弃开源的平台而选择我们。”汤晓鸥堵住了退路。
“好,既然硬件和数据库都不如对手,那就拼计算能力!”徐立也下了死命令。
拼计算能力,说白了,就是拼题海战术,就是让超算平台每天进行10亿次级别的算法训练,加速平台的自我修复,“分析的数据越多,计算、识别结果就会越精确。”
关键时候,徐立先后拿下小米手机、华为手机、美图秀秀、微博面孔相册,图聊软件Faceu,Snow等大客户。要知道,这些产品应用,每一个均是千万量级以上的客户。
结果,不到三个月,商汤的识别准确率就达到98.52%,第一次超越人眼97.53%。
从此,商汤一炮打响!
四、目标是星辰大海
此后,2014年9月,在国际知名的ImageNet竞赛中,商汤以高出第二名11个百分点的压倒性优势,实现夺冠。
不过,准确率只是第一步,人脸识别的难点在于判断操作手机的是不是一个真实的人,也就是活体检测,“到底是一个真人还是仿冒攻击。”
这难不倒徐立,他的招法就是以毒攻毒,徐立甚至打入过黑色产业内部的群里,花1000甚至2000块钱,就为买一个人脸识别破译本,“看看黑色产业到底用了什么办法破解,以便针对性地补上漏洞。”
在反复的测试、较量中,商汤的人脸识别正确率大涨。仅仅1年后,误识率已降低到了百万分之一,“相当于1年时间就长成了一个18岁成年人的大脑。”
系统的威力很快发挥。2015年初,在与广东一家市级公安局合作时,短短40天时间就识别出69个嫌疑人,最后逮捕14人。要知道,此前靠人力进行图像识别,一年时间才能够抓捕两人。
这个时候,徐立把商汤的商业模式演变为1+1+X,“第一个1代表研发,第二个1代表技术产业化,而X则代表着赋能合作伙伴”。
很快,第一批安防业务在深圳市政府、西安市政府等10个城市开花结果。
很快,第一个交通出行项目在国内最大地铁公司上海申通地铁签约。
很快,第一本人工智能高中教材问世,并与清华附中、上海交大附中等40所国内重点中学签约。
2016年,商汤迎来业务爆发之年,订单和营收规模上获得爆发性增长。中国移动、银联、OPPO、vivo、科大讯飞、京东等超过400家知名机构、企业均成为商汤签约客户。
此后,徐立带领公司700多号员工在智慧城市、智能手机、互联网娱乐、汽车、金融、零售等11个行业快速落地,商汤的业务营收连续3年保持400%的同比增长,2017主营业务合同收入更是增长10多倍。
资本方纷涌而来。短短3年,商汤就完成5轮超过16亿美元的融资,估值超过310亿。投资方囊括了鼎晖、阿里巴巴、高通、中银集团淡马锡、厚朴投资、老虎基金等等全球一线基金,可以说,大伙能够想到的投资机构全来了。
徐立呢,也把人脸布控实战平台升级到第三代的 SenseFace 人脸识别系统,“实现大规模的黑名单布控。”
也就是说,一套后台系统能够同时对接几千路的视频,并对城市中的人流进行实时监控和报警。据说,这套人脸识别安防系统可以追踪并记录过去半年内特定人员的完整轨迹。
而方舟城市视觉平台,更是把人脸识别错误率降低到亿万分之一。事实上,一个500万人口的二线城市只需8台服务器,就能支持万路摄像头,并能够对1000亿级的数据进行搜索。


如今,商汤 AR 技术在短视频、相机、直播等市场占有率超过 80%,小咖秀、Faceu、熊猫直播等大热 APP 的背后,都有商汤的身影。
至于内容阅读方面更是商汤的拿手好戏,“能够过滤色情、暴力内容,识别图像中的敏感文字,甚至能够区分裸体艺术品和色情图片。”
令人惊叹的是,完成这一工作量,只需一台商汤服务器,但如果换成人工,则需要 500 人甚至 2000 人的团队。
此外,徐立对汽车驾驶也有布局,商汤监控系统可以对驾驶员疲劳及注意力分散等行为进行监测,例如睁闭眼、打哈欠、视线偏移、分心等,准确度已超过 98%。未来一旦投入使用,由于疲劳驾驶所导致的恶性事故将大大降低!
而徐立刚刚36岁,一切才刚刚开始!
精彩人物
继续阅读
阅读原文