作者:Decode

“我和文斌很久没有同框,平时的活动本着高效原则不会出两个人头,这次两个人都出了。”

在 2020 年7 月 29 日旷视一场交流会上,旷视 CEO 印奇开场时说道。2011 年,印奇、唐文斌和杨沐三位同学一起,创立了旷视,印奇任 CEO,唐文斌是 CTO。如他所说,“本着高效原则”,两人很少会同时出席一个活动。
交流会当天,两人身着看不出区别的黑衣黑裤亮相,用比常人快 1.5 倍的语速,讲述着从事 AI 九年来的思考和积累。和旷视过去的发布会及媒体活动一样,内容硬,信息密度大。
很容易就能概括出两人身上的共同点:极客、追求高效。都说公司文化由创始人决定,旷视所做的事,正是利用技术来提升效率。
2015 年,旷视进入城市安防市场,用 AI 来分析视频数据,减轻人工压力。2017 年,旷视切入仓储物流领域,通过 AI 来提高货物分拣效率。“我是非常相信一个概念的,就是‘AI小于 IoT’。”谈及旷视布局各种场景的物联网,印奇如是说,“AI 是物联网里一个核心计算能力。”
技术无疑是旷视的强项,但能否用技术为产业创造真正的价值,进而成功商业化,一直是外界对这家 AI 公司的质疑点。
在进入交流会场地的一条必经小道上,旷视装订了一排海报,其中一张主角是旷视研究院基础模型组负责人张祥雨。海报上写着:他在工作之余,3 年看了 1800 篇论文,平均每天看两篇。创业九年,旷视依旧是“学霸”人设、学术竞赛的常胜将军。但旷视终归是一家商业公司,“学霸”正在学着做生意,其 2019 年提交的首次公开发行股票招股说明书,已经让外界看到 AI 商业化的方向和可能。

从 FaceID 起家

旷视整体业务布局很清晰,在技术底层有深度学习框架 Brain++,在业务层划分为三个部分:个人物联网、城市物联网和供应链物联网,对应的场景有个人移动设备和身份认证、智慧城市和智慧社区、智慧物流和智慧零售。
旷视把这样的布局形容为“1+3”战略,唐文斌在交流会上表示,业务板块不会再往外扩,“我们要做的事情是把它们做深做实,不管是技术层面还是产品层面”。
旷视对 AI 技术商业化的探索,始于手机这个只有几英寸大小的设备。2012 年上线的图像识别开发者平台 Face++,为旷视带来了美图和世纪佳缘等第一批客户。而后,旷视半年内推出三款面向消费者的产品,其中一款是基于前置摄像头的游戏 App “面相大师”,没有任何推广情况下,在 App Store 冲到了免费榜前三。
但做游戏过程中,旷视团队发现,AI 仅能带来新奇感,而一款游戏想要持续成功,更多是靠激励机制。“AI 的增值可能没这么大,于是我们不做游戏了。”唐文斌在交流会上说。加上另外两款消费者产品反响平平,旷视看到了 AI 在消费者场景暂时没有刚需的现实,自此专注于企业级市场。
人脸识别身份验证服务 FaceID,是旷视第一个获得成功的企业级产品。2015 年 3 月,马云在汉诺威大会上展示支付宝刷脸支付,背后的技术正是来自于旷视。这之后,银行业开始广泛接受基于人脸识别的远程身份核实,旷视凭借着 FaceID 获取了可观的市场份额,客户覆盖金融科技公司(如招联金融)、金融机构和网约车平台(如首汽约车)。
旷视在招股书中透露,FaceID 解决方案的客户由 2016 年的 128 名增长至 2018 年的 1044 名,复合年增长率为 185.6%。招股书援引灼识咨询的报告称,按 2018 年收入计算,旷视是中国最大的云端人脸识别身份验证解决方案商,占据超过 60% 的市场份额。
2017 年,在手机摄像头中加入 AI 算法成为行业趋势,旷视顺势推出计算摄影解决方案。“我们很早的时候就在思考,图像数据流是单向的,未来能不能变成更复杂的。”唐文斌说,“印奇在创业初期去哥伦比亚大学攻读,就是计算摄影方向。”
除了计算摄影,旷视还为手机厂商提供人脸识别设备解锁方案。如今,旷视的设备解锁和计算摄影方案,已经搭载在小米、OPPO 和 Vivo 手机上。据灼识咨询报告,2018 年中国制造的搭载人脸识别设备解锁功能的 Android 智能手机中,有超过 70% 都采用了旷视的解锁方案。
在旷视的个人物联网业务中,Face++ 和 FaceID 被归为 SaaS,而计算摄影和设备解锁被归为个人设备。2019 年,两部分加起来的收入为 2.07 亿元,占旷视总收入的 21.8%。
在这个业务方向上,旷视不再满足于只提供软件层面的方案,印奇在交流会上透露,今年下半年或明年第一季度,旷视自研的一款软硬一体化传感器,就能在合作伙伴的手机里看到。

让 AI 进入城市和生产空间

城市物联网是 AI 视觉企业的必争之地,旷视也不例外。2015 年11 月,旷视开始提供城市物联网解决方案。具体落地场景上,大多数 AI 视觉聚焦在公共安全领域,而旷视还拓展到交通、商业楼宇、社区和学校等场景。
在和海康威视、大华以及其他 AI 视觉公司的竞争中,旷视从一个纯算法公司,成长为一家集算法、软件和硬件一体的方案商。
“我们的城市物联网解决方案包括算法、软件和人工智能赋能的传感器。”旷视在招股书中如此描述这项业务。言下之意,旷视提供的是一揽子方案。“任何一个 2B 或 2C 企业都不会只买个算法。”印奇说,“AI 算法落地过程中,AI 公司首先要成为系统集成商。”
算法层面,旷视打造了一个平台型软件,可接入自研和第三方的摄像头和传感器,也能连接其他应用程序。得益于自研的云端神经网络 ResNet,平台可以对视频数据进行结构化分析和分类管理。
软件方面,由于城市治理中不同场景有特定需求,旷视要针对性地开发应用。比如,安防场景下,软件实时分析摄像头录得的视频,减轻人工压力;交通管理场景下,软件 24 小时分析实时车流,自动识别交通违规(如非法停车)。
硬件是旷视做城市物联网的特色。早在 2015 年 10 月,旷视就推出了一款智能传感器。此后,推出了 30 多款基于 AI 能力的 MegEye 系列摄像头。同时,旷视开发了边缘服务器,让视频数据分析在边缘进行,不仅反应速度更快,还能减少带宽成本。
印奇在交流会上总结道:“算法、软件和硬件在一起设计之后,确实比单独设计软件、算法和硬件效果要好得多。今年下半年,旷视在边缘能力上,会有越来越多 AI 硬件诞生。”
经过几年发展,城市物联网业务已经是旷视的收入支柱。2019 年上半年,来自城市物联网的收入为 6.95 亿元,占总收入的 73.2%。但这部分收入面临着一定不确定性。旷视在招股书中提示,来自城市物联网的收入受政府支出和城市政策影响,“无法保证政府在城市物联网解决方案上的支出,将继续增长或保持在当前水平”。
2017 年前后,AI 视觉企业纷纷在城市物联网赛道之外,寻找新的增长点。旷视通过仓储物流场景,切入到供应链物联网。
仓储物流场景涉及诸多不同品牌方的软件和硬件,它们之间的沟通协作是一个难题。旷视看准了这个机会,于 2019 年统一操作平台“河图”。
这个平台一方面可以接入上下游设备(包括软件和硬件),另一方面能为仓库里所有物品和人员生成数字孪生,并且智能协调机器人规划最佳路线和避开障碍。在这个过程中,旷视擅长的 AI 视觉技术,体现在帮助机器人自动避障,和以厘米级精度将物品运送至指定位置。
和做城市物联网一样,旷视选择软硬结合的路线,并且做得更加重。2017 年,旷视科技投资孵化了物流机器人企业艾瑞思。2018 年 4 月,旷视科技全资收购艾瑞思,正式将机器人作为自己一项重点业务。“在供应链体系下,我们核心产品是机器人。今年 9 月,我们会推出更多 AI 机器人,不只是一个产品,而是产品族。”印奇在交流会上表示。
供应链物联网作为一个新业务,虽然 2019 年上半年收入仅为 4697 万元,只占到总收入 5%,但同比增速有 51.2%。旷视在招股书中举了一个标杆案例:天猫超市仓储服务合作商心怡科技,自 2018 年起部署旷视的物流方案,近 400 个机器人在仓库内自动导航。除了心怡科技,旷视还和科捷物流、海柔创新等专门的物流公司达成了合作。

保证不被卡脖子的深度学习框架

旷视的“1+3”战略中,最重要部分其实是底层的深度学习框架 Brian++。这个在今年宣布开源的深度学习框架囊括了 AI 三要素:数据管理平台 MegData、算法生成平台 MegEngine(中文名:天元) 以及云计算平台 MegCompute。
旷视在招股书里把 Brain++ 形容为其“核心竞争力” ,为什么这个框架这么重要?
深度学习技术的落地过程,涉及到多个不同的步骤和工具。如果从头开始设计一个深度神经网络,需要开发人员对底层技术非常了解。这就把很多对深度学习感兴趣的开发者和公司拒之门外。
即使开发者对深度学习底层技术了如指掌,从零开始设计神经网络非常耗时,通常按周和月计,不仅效率低,而且容易让人失去耐心。因此,有机构把底层语言和重要的神经网络模型进行了封装,“打包” 给开发者使用。开发者不必操心底层技术,只需要调用顶层 API 就可以应用深度学习神经网络。
这种封装了底层语言和重要模型的工具,被称之为 “深度学习框架”。好比你要炒一盘菜,不会从研究怎么制造锅或铲开始,而是直接拿现成的用。对于打造一个深度学习应用,数据相当于食材,算法相当于菜谱,而深度学习框架就类似于锅和铲。
在深度学习框架的竞争中,Google 的 TensorFlow 和 Facebook 的 PyTorch 处于领先地位,还有一些开源项目也颇受欢迎,比如 Keras 和 MXNet,但无一例外,都是美国的。在中美贸易战愈演愈烈的今天,拥有自己的深度学习框架,才能保证不被卡脖子。
印奇说:“我们内部可以使用 TensorFlow 和 PyTorch 任何框架,但所有加入旷视的人,他们自发地用 Brain++。个人从旷视离开的同事,发现到了另外一个平台没有 Brain++,研发效率非常低。”
面对其他深度学习框架的竞争,Brain++ 具备自身的特点。其一,针对计算机视觉任务做出定制优化,适合大量图像及视频训练等复杂的视觉任务。
其二,Brain++ 配备了一项名为 AutoML 的技术。这是一种自动化设计、训练 AI 算法的技术。在应用 AI 过程中,训练、调参并优化算法,一直是个缓慢且耗力的过程。“旷视已经打造了很多算法,但我们还是认为,产生一个算法成本太高,周期太长,还没有办法让算法像现在的软件一样,想写就写,写完还能有用。”印奇说,“现在真正算法供给能力,相比较应用需求可能连 1% 都不到,这是我们作为算法公司认清的一个现状。”
AutoML 正是解决这一问题的关键。利用这一技术,Brain++ 构建出一条半自动的算法开发生产线,在不降低算法质量基础上,节省了不少成本。印奇在交流会上透露,经过各方面实践发现,从需求到落地,Brain++ 能够缩短 80% 左右的时间,同时降低 55% 左右的算法生产成本。
总的来说,旷视在技术上有稳定的保证,而三项主营业务往大了说,就是消费电子、城市治理和制造业,至少跑道足够长。但旷视面临的挑战同样不小,如何以更低成本将更好的 AI 部署在产业是一场持久战。对于外界十分关心的上市,印奇在交流上回应道:“我们现金流很充裕,上市的事情还是会在合适的时间稳步推进。”
继续阅读
阅读原文