深度学习图像技术的又一突破性应用：蚂蚁金服发布“定损宝”

导读

长期以来，车险定损（通过现场拍摄定损照片确定车辆损失，以作为保险公司理赔的依据）是车险理赔中最为重要的操作环节。保险公司往往需要雇佣大量人力长期派驻多地进行重复的拍照、定损等一系列作业，并通过持续的培训提升定损人员的专业技能。这种模式给保险公司造成了极大的人力和管理成本。蚂蚁金服最新发布了“定损宝”产品，依托深度学习图像算法的最新研究成果，使用AI算法逐步替代定损环节中的重复性人工作业流程，将大大降低车险定损环节中的人力以及管理成本。

北京时间2017年6月27日下午，蚂蚁金服在北京对保险全行业发布了最新的车险理赔定损产品“定损宝”。这是蚂蚁金服首次将业界领先的深度学习图像技术应用于保险场景中。

深度学习图像技术助力传统保险行业

自2006年，Geoffery Hinton等人在《Science》上发表的文章Reducing the dimensionality of datawith neural networks开始，深度学习的热潮从学术界蔓延至工业界，引起产业界充分的注意和重视。十多年来，深度学习成为人工智能中最受关注的领域，它在语音识别、自然语言处理、计算机视觉、图像与视频分析、多媒体等诸多领域的获得了广泛的应用和成果。

图像是深度学习最早开始尝试的应用领域，事实也证明了图像在深度学习中具有充分的优势。在现实中，深度学习对图像处理的技术能力，从信息检索、视频监控、智能家居、机器人一直延伸到医疗影像等多多重场景，深度学习在图像的应用正以前所未有的速度和广度向日常生活覆盖。

此次蚂蚁金服“定损宝”的发布正式吹响了深度学习图像技术助力传统保险行业创新的号角。发布会的现场，蚂蚁金服首席数据科学家漆远博士说：“未来三十年，是人类最关键、最需要重视、最需要把握的三十年。新技术将融合到传统行业的方方面面，引领人类社会天翻地覆的变化。不管你是什么人，不管你身处哪里，我们所有每个人都会是这场大变革的一部分。”

▲蚂蚁金服首席数据科学家漆远博士

定损宝：更快、更精确的车险定损

从用户体验上看以往传统保险公司的车险处理流程，一般为报案、现场查勘、提交理赔材料、审核、最终赔付。用户完成整套链路获得理赔的周期往往长达几周甚至一个月。蚂蚁“定损宝”的终极目标不仅仅是服务于保险公司，更要在未来通过深度学习技术解决用户长期的痛点，使得用户在车险理赔过程中可以在现场拍照上传图片，在几秒内就能得到准确的定损结论，并快速获得理赔。

车险事故定损的核心在于损伤认定：查勘员根据事故现场, 做出损伤原因的初步判断, 然后确认损伤的车部件以及损伤程度。查勘员往往会在事故现场拍摄一系列照片作为定损记录和依据。部分案例中的图片数高达几百张,其中只有少量图片可以支持有效的定损判断；同时图与图之间的关系也十分复杂，为快速定损带来极大的挑战。蚂蚁金服“定损宝”背后的深度学习图像技术的主要工作就是从整案图片中筛选出若干张有效定损图片，并准确提炼出事故定损信息, 给出和专业查勘员一致的定损结论。

解决图像识别的世界级难题

在过去的5年里，深度学习以及计算机视觉技术获得了长足发展，在部分简单的任务上(比如ImageNet分类)甚至达到了比人更高的精确度，但是面对车险定损这样一个复杂的现实场景，算法的攻坚道路仍是困难重重。国内外有多个优秀的人工智能团队尝试攻克这一难题，但是在车险定损领域依然鲜见有效的技术方案落地。在现实场景中，算法需要应对多种复杂光照条件、污渍、水滴、车型构造等多种干扰因素，并从海量数据中学习到对定损有效的关键信息。

在整体技术方案设计链路中，每一个环节都是一个世界级的计算机视觉难题。首先需要面对的是千万级的车险定损历史图片，对这些杂乱无章的图片进行结构化规整、数据整理、清洗以及必要的标注。这个庞大图像数据库的照片数量以及标签的复杂程度对比ImageNet都要高出一个数量级。而车险定损问题本身对算法的挑战则更是可以说前所未有。以损伤程度判定模块为例，损伤程度的判定是整个定损中的核心环节。在真实环境中，照片拍摄的车体损伤非常容易受到反光、阴影、污渍、车体流线型的干扰造成误判，即使是人眼通过照片观察，也很难区分在分析了多个会对损伤判定造成干扰的因素之后，针对不同的车型、颜色和光照条件进行模型迭代学习，融合多个模型的经验, 产出了现在的定损宝解决方案。该技术能够精准地输出针对各种程度的刮擦、变形、部件的开裂和脱落等损伤的定损结论。

蚂蚁金服“定损宝”的发布只是传统保险行业中深度学习图像技术应用上的开端。相比传统图像技术, 深度学习的对大数据的自学习能力、强泛化性能、高准确率的优势，使其成为整个行业发展的重要动力。目前工业界尤其是互联网行业都纷纷加大了在深度学习方面的投入，谷歌、Facebook、微软、亚马逊纷纷建立了自己的人工智能团队，甚至斥巨资收购人工智能图像识别领域的初创公司，双管齐下构建各自的深度学习技术能力。蚂蚁金服围绕深度学习图像技术领域的研究早已有之，在2015年的德国汉诺威IT和通信产业盛会CeBIT开幕式上，马云就已经亲自演示了蚂蚁金服的Smile to Pay扫脸支付技术，这充分证明了深度学习在图像领域取得的成就，已经可以达到一定程度的商业化。鉴于对学术以及工业界产生的巨大影响，深度学习曾被《麻省理工科技评论》列为世界十大技术突破之首。

▲蚂蚁金服“定损宝”与保险公司定损人员PK现场

人工智能非常强调学习能力的提升，这要求算法的准确度随着经验数据的积累不断提升。所以，大数据时代的到来给人工智能的发展带来了新的机遇。在这个时代背景下，深度学习在包括图像识别等方面所取得的突破性进展并非偶然。

自2012年多伦多大学AlexNet发布引发学术地震以来，从学术界的角度而言，计算机视觉技术，尤其是算法层面取得了非常大的进展。深度学习形成的从训练数据出发，经过端到端模型后直接输出得到最终结果的新模式使得深度学习对参数的调整可以完全自动化并不断优化，最终提高模型的准度。此外得益于以Nvidia GPU为代表的高性能计算芯片的快速发展，深度学习可以通过海量数据自学习进行抽象知识的表达，对原始数据进行信息浓缩，并快速提升模型的精度。

基于深度学习算法的图像技术也逐渐在人工智能领域打开新的局面。图像数据在空间维度上天然具有良好的结构性和连续性，对图像进行旋转、平移、错切、缩放、高斯等图像变换处理，能够强化现有训练数据集，增强深度学习模型的鲁棒性。在图像相关的应用中，以卷积神经网络为基础的算法在图像目标检测，视频分析，像素级分割，图像语义理解上都取得了重大突破。卷积神经网络的设计利用了人脑对图像认知的基本模式，其中的卷积和池化都来自于脑科学领域。不仅是受益于脑神经科学，在优化理论，统计学上的颇多研究结果，都有助于在深度模型中引入新的有效的操作和层，对于提高图像识别的性能有着重要意义。

目前在产业界深度学习主流学习方法还是有监督的学习方法, 但监督的学习方法非常依赖于图像的标注。不论是简单的分类标注还是比较复杂的图像分割，标注始终是个成本很高的任务。在研究领域, 无监督学习的探索, 如何利用目前已有的大量无标注数据是学术界一直在尝试解决的问题。最近非常火爆的生成对抗网络GAN就是近期学术界一个颇有意义的尝试。

深度学习技术应用于互联网产品，可大大增强用户体验，进一步吸引更多用户，获得更多的用户反馈。但随之而来，每时每刻飞速膨胀的数据量使得超大规模的并行计算成为助力深度学习必备的技术能力。蚂蚁金服在超大规模并行计算上有着深厚的积累, 基于ASIC、FPGA、GPU等芯片技术的软硬一体化异构机器学习平台，可以满足各种超大规模复杂AI模型的训练和在线推理。基于Parameter Server计算框架下的深度学习, 在线学习支持100亿特征、1000亿样本、10000亿参数规模的模型训练。

图像深度学习技术日新月异, 相信在不远的将来, 随着领域基础技术的不断提升, 深度学习的图像识别技术将在通用性学习能力上有更大的飞跃。

深度学习技术的发展必然带动市场对深度学习人才的渴望。从2015年开始，市场对深度学习人才的需求直线上涨，2016年开始至今更是以超大幅度上涨，同时大量的学术界顶尖人才流向产业界。前不久人工智能领域的泰斗迈克尔.欧文.乔丹(Michael I. Jordan)正式加盟蚂蚁金服，担任新成立的蚂蚁金服科学智囊团主席。在蚂蚁, 以漆远博士为代表的数据科学家, 以及来自世界一流高科技企业、学术界的人工智能人才正迅速集结。

▲人工智能领域的泰斗迈克尔.欧文.乔丹(Michael I. Jordan)

点击上图了解相关信息

若要问哪些因素的发展会助力深度学习图像技术的进一步应用，蚂蚁金服的回答是：与行业业务和海量数据的深度结合, 深度学习图像识别领域软硬件技术持续高速的发展都将会助力深度学习图像技术的进一步应用。在服务器端随着GPU/FPGA计算能力的不断提高，使得层数更多、更复杂的模型的训练成为可能；在移动端随着嵌入式神经网络芯片的研发，以及神经网络压缩算法的提出与优化，使得越来越多的深度学习图像技术可以在移动终端上落地，应用场景变得更多元化。眼下蚂蚁金服AI与保险行业的深度合作只是计算机视觉应用领域的落地结果之一，技术将为广大保险公司和普通用户提供便捷可靠的服务，强有力地推进行业的效能。而深度学习乃至整个人工智能领域的深度研究与应用，将有可能解决产业中面临的更多问题，给人们带来更好的用户体验。

END

长按识别图中二维码

一键关注“蚂蚁程序猿”

了解蚂蚁金服前沿新科技

继续阅读

阅读原文