从AI到IoT，如何理解今日之旷视？

作者：Decode

邮箱：[email protected]

“我和文斌很久没有同框，平时的活动本着高效原则不会出两个人头，这次两个人都出了。”

在 2020 年7 月 29 日旷视一场交流会上，旷视 CEO 印奇开场时说道。2011 年，印奇、唐文斌和杨沐三位同学一起，创立了旷视，印奇任 CEO，唐文斌是 CTO。如他所说，“本着高效原则”，两人很少会同时出席一个活动。

交流会当天，两人身着看不出区别的黑衣黑裤亮相，用比常人快 1.5 倍的语速，讲述着从事 AI 九年来的思考和积累。和旷视过去的发布会及媒体活动一样，内容硬，信息密度大。

很容易就能概括出两人身上的共同点：极客、追求高效。都说公司文化由创始人决定，旷视所做的事，正是利用技术来提升效率。

2015 年，旷视进入城市安防市场，用 AI 来分析视频数据，减轻人工压力。2017 年，旷视切入仓储物流领域，通过 AI 来提高货物分拣效率。“我是非常相信一个概念的，就是‘AI小于 IoT’。”谈及旷视布局各种场景的物联网，印奇如是说，“AI 是物联网里一个核心计算能力。”

技术无疑是旷视的强项，但能否用技术为产业创造真正的价值，进而成功商业化，一直是外界对这家 AI 公司的质疑点。

在进入交流会场地的一条必经小道上，旷视装订了一排海报，其中一张主角是旷视研究院基础模型组负责人张祥雨。海报上写着：他在工作之余，3 年看了 1800 篇论文，平均每天看两篇。创业九年，旷视依旧是“学霸”人设、学术竞赛的常胜将军。但旷视终归是一家商业公司，“学霸”正在学着做生意，其 2019 年提交的首次公开发行股票招股说明书，已经让外界看到 AI 商业化的方向和可能。

从 FaceID 起家

旷视整体业务布局很清晰，在技术底层有深度学习框架 Brain++，在业务层划分为三个部分：个人物联网、城市物联网和供应链物联网，对应的场景有个人移动设备和身份认证、智慧城市和智慧社区、智慧物流和智慧零售。

旷视把这样的布局形容为“1+3”战略，唐文斌在交流会上表示，业务板块不会再往外扩，“我们要做的事情是把它们做深做实，不管是技术层面还是产品层面”。

旷视对 AI 技术商业化的探索，始于手机这个只有几英寸大小的设备。2012 年上线的图像识别开发者平台 Face++，为旷视带来了美图和世纪佳缘等第一批客户。而后，旷视半年内推出三款面向消费者的产品，其中一款是基于前置摄像头的游戏 App “面相大师”，没有任何推广情况下，在 App Store 冲到了免费榜前三。

但做游戏过程中，旷视团队发现，AI 仅能带来新奇感，而一款游戏想要持续成功，更多是靠激励机制。“AI 的增值可能没这么大，于是我们不做游戏了。”唐文斌在交流会上说。加上另外两款消费者产品反响平平，旷视看到了 AI 在消费者场景暂时没有刚需的现实，自此专注于企业级市场。

人脸识别身份验证服务 FaceID，是旷视第一个获得成功的企业级产品。2015 年 3 月，马云在汉诺威大会上展示支付宝刷脸支付，背后的技术正是来自于旷视。这之后，银行业开始广泛接受基于人脸识别的远程身份核实，旷视凭借着 FaceID 获取了可观的市场份额，客户覆盖金融科技公司（如招联金融）、金融机构和网约车平台（如首汽约车）。

旷视在招股书中透露，FaceID 解决方案的客户由 2016 年的 128 名增长至 2018 年的 1044 名，复合年增长率为 185.6%。招股书援引灼识咨询的报告称，按 2018 年收入计算，旷视是中国最大的云端人脸识别身份验证解决方案商，占据超过 60% 的市场份额。

2017 年，在手机摄像头中加入 AI 算法成为行业趋势，旷视顺势推出计算摄影解决方案。“我们很早的时候就在思考，图像数据流是单向的，未来能不能变成更复杂的。”唐文斌说，“印奇在创业初期去哥伦比亚大学攻读，就是计算摄影方向。”

除了计算摄影，旷视还为手机厂商提供人脸识别设备解锁方案。如今，旷视的设备解锁和计算摄影方案，已经搭载在小米、OPPO 和 Vivo 手机上。据灼识咨询报告，2018 年中国制造的搭载人脸识别设备解锁功能的 Android 智能手机中，有超过 70% 都采用了旷视的解锁方案。

在旷视的个人物联网业务中，Face++ 和 FaceID 被归为 SaaS，而计算摄影和设备解锁被归为个人设备。2019 年，两部分加起来的收入为 2.07 亿元，占旷视总收入的 21.8%。

在这个业务方向上，旷视不再满足于只提供软件层面的方案，印奇在交流会上透露，今年下半年或明年第一季度，旷视自研的一款软硬一体化传感器，就能在合作伙伴的手机里看到。

让 AI 进入城市和生产空间

城市物联网是 AI 视觉企业的必争之地，旷视也不例外。2015 年11 月，旷视开始提供城市物联网解决方案。具体落地场景上，大多数 AI 视觉聚焦在公共安全领域，而旷视还拓展到交通、商业楼宇、社区和学校等场景。

在和海康威视、大华以及其他 AI 视觉公司的竞争中，旷视从一个纯算法公司，成长为一家集算法、软件和硬件一体的方案商。

“我们的城市物联网解决方案包括算法、软件和人工智能赋能的传感器。”旷视在招股书中如此描述这项业务。言下之意，旷视提供的是一揽子方案。“任何一个 2B 或 2C 企业都不会只买个算法。”印奇说，“AI 算法落地过程中，AI 公司首先要成为系统集成商。”

算法层面，旷视打造了一个平台型软件，可接入自研和第三方的摄像头和传感器，也能连接其他应用程序。得益于自研的云端神经网络 ResNet，平台可以对视频数据进行结构化分析和分类管理。

软件方面，由于城市治理中不同场景有特定需求，旷视要针对性地开发应用。比如，安防场景下，软件实时分析摄像头录得的视频，减轻人工压力；交通管理场景下，软件 24 小时分析实时车流，自动识别交通违规（如非法停车）。

硬件是旷视做城市物联网的特色。早在 2015 年 10 月，旷视就推出了一款智能传感器。此后，推出了 30 多款基于 AI 能力的 MegEye 系列摄像头。同时，旷视开发了边缘服务器，让视频数据分析在边缘进行，不仅反应速度更快，还能减少带宽成本。

印奇在交流会上总结道：“算法、软件和硬件在一起设计之后，确实比单独设计软件、算法和硬件效果要好得多。今年下半年，旷视在边缘能力上，会有越来越多 AI 硬件诞生。”

经过几年发展，城市物联网业务已经是旷视的收入支柱。2019 年上半年，来自城市物联网的收入为 6.95 亿元，占总收入的 73.2%。但这部分收入面临着一定不确定性。旷视在招股书中提示，来自城市物联网的收入受政府支出和城市政策影响，“无法保证政府在城市物联网解决方案上的支出，将继续增长或保持在当前水平”。

2017 年前后，AI 视觉企业纷纷在城市物联网赛道之外，寻找新的增长点。旷视通过仓储物流场景，切入到供应链物联网。

仓储物流场景涉及诸多不同品牌方的软件和硬件，它们之间的沟通协作是一个难题。旷视看准了这个机会，于 2019 年统一操作平台“河图”。

这个平台一方面可以接入上下游设备（包括软件和硬件），另一方面能为仓库里所有物品和人员生成数字孪生，并且智能协调机器人规划最佳路线和避开障碍。在这个过程中，旷视擅长的 AI 视觉技术，体现在帮助机器人自动避障，和以厘米级精度将物品运送至指定位置。

和做城市物联网一样，旷视选择软硬结合的路线，并且做得更加重。2017 年，旷视科技投资孵化了物流机器人企业艾瑞思。2018 年 4 月，旷视科技全资收购艾瑞思，正式将机器人作为自己一项重点业务。“在供应链体系下，我们核心产品是机器人。今年 9 月，我们会推出更多 AI 机器人，不只是一个产品，而是产品族。”印奇在交流会上表示。

供应链物联网作为一个新业务，虽然 2019 年上半年收入仅为 4697 万元，只占到总收入 5%，但同比增速有 51.2%。旷视在招股书中举了一个标杆案例：天猫超市仓储服务合作商心怡科技，自 2018 年起部署旷视的物流方案，近 400 个机器人在仓库内自动导航。除了心怡科技，旷视还和科捷物流、海柔创新等专门的物流公司达成了合作。

保证不被卡脖子的深度学习框架

旷视的“1+3”战略中，最重要部分其实是底层的深度学习框架 Brian++。这个在今年宣布开源的深度学习框架囊括了 AI 三要素：数据管理平台 MegData、算法生成平台 MegEngine（中文名：天元）以及云计算平台 MegCompute。

旷视在招股书里把 Brain++ 形容为其“核心竞争力” ，为什么这个框架这么重要？

深度学习技术的落地过程，涉及到多个不同的步骤和工具。如果从头开始设计一个深度神经网络，需要开发人员对底层技术非常了解。这就把很多对深度学习感兴趣的开发者和公司拒之门外。

即使开发者对深度学习底层技术了如指掌，从零开始设计神经网络非常耗时，通常按周和月计，不仅效率低，而且容易让人失去耐心。因此，有机构把底层语言和重要的神经网络模型进行了封装，“打包” 给开发者使用。开发者不必操心底层技术，只需要调用顶层 API 就可以应用深度学习神经网络。

这种封装了底层语言和重要模型的工具，被称之为 “深度学习框架”。好比你要炒一盘菜，不会从研究怎么制造锅或铲开始，而是直接拿现成的用。对于打造一个深度学习应用，数据相当于食材，算法相当于菜谱，而深度学习框架就类似于锅和铲。

在深度学习框架的竞争中，Google 的 TensorFlow 和 Facebook 的 PyTorch 处于领先地位，还有一些开源项目也颇受欢迎，比如 Keras 和 MXNet，但无一例外，都是美国的。在中美贸易战愈演愈烈的今天，拥有自己的深度学习框架，才能保证不被卡脖子。

印奇说：“我们内部可以使用 TensorFlow 和 PyTorch 任何框架，但所有加入旷视的人，他们自发地用 Brain++。个人从旷视离开的同事，发现到了另外一个平台没有 Brain++，研发效率非常低。”

面对其他深度学习框架的竞争，Brain++ 具备自身的特点。其一，针对计算机视觉任务做出定制优化，适合大量图像及视频训练等复杂的视觉任务。

其二，Brain++ 配备了一项名为 AutoML 的技术。这是一种自动化设计、训练 AI 算法的技术。在应用 AI 过程中，训练、调参并优化算法，一直是个缓慢且耗力的过程。“旷视已经打造了很多算法，但我们还是认为，产生一个算法成本太高，周期太长，还没有办法让算法像现在的软件一样，想写就写，写完还能有用。”印奇说，“现在真正算法供给能力，相比较应用需求可能连 1% 都不到，这是我们作为算法公司认清的一个现状。”

AutoML 正是解决这一问题的关键。利用这一技术，Brain++ 构建出一条半自动的算法开发生产线，在不降低算法质量基础上，节省了不少成本。印奇在交流会上透露，经过各方面实践发现，从需求到落地，Brain++ 能够缩短 80% 左右的时间，同时降低 55% 左右的算法生产成本。

总的来说，旷视在技术上有稳定的保证，而三项主营业务往大了说，就是消费电子、城市治理和制造业，至少跑道足够长。但旷视面临的挑战同样不小，如何以更低成本将更好的 AI 部署在产业是一场持久战。对于外界十分关心的上市，印奇在交流上回应道：“我们现金流很充裕，上市的事情还是会在合适的时间稳步推进。”

继续阅读

阅读原文