夏乙 若朴 发自 凹非寺

量子位 出品 | 公众号 QbitAI
何恺明第三次斩获顶会最佳论文!

昨天下午,ICCV 2017最佳论文公布。
何恺明为一作的Mask R-CNN论文,不负众望获得最佳论文(Marr Prize)。
另外,何恺明参与的另一篇论文:Focal Loss for Dense Object Detection,也被大会评为最佳学生论文。
作为计算机视觉领域的顶级会议,ICCV 2017共收到2143篇论文投稿,其中621篇被选为大会论文(入围比例29%),其中56篇亮点报告(Spotlight),45篇口头报告(Oral)。
本次ICCV 2017大会,参会人数再创新高,达到3107名。在30年ICCV大会历史上,堪称火爆出奇的一届。
从参会人数上来看,来自美国的最多,达到749人;来自中国的次之,达到362人。排进前五的还包括:德国(274人)、韩国(229人)、英国(218人)。

Mask R-CNN简史

还是得详细说一说Mask R-CNN
这篇论文主要解决的是“实例级的”对象分割,也就是把照片中的人、动物等对象,一个一个地从图像中检测出来,并同时为每个对象实例生成一个高质量分割遮罩。
根据Mask R-CNN论文中所写的,这个算法在COCO数据集的三类任务上,Mask R-CNN都取得了顶尖的成绩,包括实例分割、边界框对象检测、以及人体关键点检测。不用任何trick,Mask R-CNN在所有任务上的性能都超越了全部现有单一模型算法,包括COCO 2016的获胜者。
获得Best Paper的消息传出之后,知乎就热闹了起来,不少同行都到Faster R-CNN相关问题下表示盼望开源代码已经判了半年。
所以,量子位就不多介绍论文内容了,认真好学但是还没读过这篇论文的朋友看这里:https://arxiv.org/abs/1703.06870
论文Preprint版今年3月在arXiv上公开后,得到了同行们的广泛认可。
比如说上学期斯坦福大学李飞飞的计算机视觉课CS231n,就在今年5月份的图像检测和分割一节里,介绍了Mask R-CNN。
再比如MIT在7月份CVPR 2017上主办的“将深度学习用于对象和场景”Tutorial,还邀请论文作者之一Ross Girshick到现场做了演讲。Girshick讲的主要内容,就是Mask R-CNN。何恺明也去了,他分享了图像识别相关的内容,涉及经典的ResNet以及CVPR 2017上发表的ResNeXt。
Mask R-CNN摘取胜利的果实时,并不是站在地上,而是站在巨人的肩膀上,而这个“巨人”,叫做Faster R-CNN,作者也包括何恺明自己,和我们前边提到的Ross Girshick。
Ross Girshik也是Facebook的研究员,江湖人称RBG大神。他和何恺明第一次合作写论文的时候,何恺明还是微软亚洲研究院员工,而RBG也还在Redmond微软研究院工作。他们,以及任少卿、孙剑的合作成果,就是Faster R-CNN。
在这之前,RBG已经长期在探索用CNN做对象检测,并发表了两篇论文,提出了R-CNN和Fast R-CNN算法。这个系列虽然历史不长,却已经成了谈CNN图像分割绕不开的经典,量子位之前也发布过相关文章
对于与何恺明的合作,RBG大神表示非常满意,至少对美国和北京之间的时差很满意。( ̄▽ ̄)”他说俩人加一起,每天可以高效工作24小时。
论文还没写完,RBG就跳槽到了Facebook AI研究院。而何恺明,在微软亚洲研究院和老朋友张翔宇、任少卿、孙剑一起,完成了后来甚至被称为图像识别算法顶峰的ResNet。
第二年,何恺明也加入了Facebook,搬到了太平洋对岸的加州门罗帕克。
何恺明和RBG大神之间的时差,顿时从12小时缩短到了几乎没有,不过好在,他们之间依然合作愉快,也就有了今年的Mask R-CNN。

传奇何恺明

ICCV 2017绝不是何恺明唯一的高光时刻。
或者说,他一路以来都似乎在以“开挂”的模式前进。
2003年,何恺明以高考满分的成绩,摘得广东高考状元。不过在高考之前,何恺明已经被保送清华。
在当年的报道中,何恺明谈到学习秘诀时说:“不知道啊,很多人都问过这个问题,但(自己)一直都不太清楚,可能是(自己)悟性好”。谈到高考后的计划,何恺明说:去桂林旅游。
直到现在,何恺明的微博上还有不少他在各地的留影,俨然一副旅游博主的感觉。
插播一句,当年与何恺明同为广东高考满分状元的还有王俊煜等人。当年王俊煜在接受采访时,谈到了自己对杂志的喜好。
2007年,尚未本科毕业的何恺明以实习生身份,进入微软亚洲研究院(MSRA)。在孙剑的指导下开始研究工作。
尝试很多方向未果之后,有天何恺明打游戏时,受到雾气场景启发,认为存在一种方法可以去除图像中的雾气。
运气和实力再次眷顾了何恺明,他很快找到简单高效的处理办法。但孙剑要求何恺明继续研究,找到成功背后的本质原因。最后何恺明写出了论文Single Image Haze Removal Using Dark Channel Prior。
最终,何恺明的这篇论文被评为CVPR 2009最佳论文。这也是中国人首次获得这一奖项。这篇论文的另外两名作者是:孙剑、汤晓鸥。
本科毕业后,何恺明进入香港中文大学读研。期间继续在微软亚洲研究院参与研究。2015年,何恺明所在的团队凭借图像识别深度残差学习(Deep Residual Learning for Image Recognition)在ImageNet上傲视群雄。
随后这篇论文被CVPR 2016评为最佳论文。这篇论文的作者还包括:张祥雨、任少卿、孙剑。
随后残差网络(ResNets)也在AI领域得到了广泛的应用,包括机器翻译、语音合成、语音识别,以及最新的AlphaGo Zero(相关报道)。
如上所述,去年8月何恺明加入Facebook人工智能研究院(FARI)。

获奖论文详情

最后,再小结下ICCV 2017的奖项。
最佳论文
  • Mask R-CNN
    作者:何恺明、Georgia Gkioxari、Piotr Dollár、Ross Girshick
    地址:https://arxiv.org/abs/1703.06870
最佳学生论文
  • Focal Loss for Dense Object Detection
    作者:Tsung-Yi Lin、Priya Goyal、Ross Girshick、何恺明、Piotr Dollár
    地址:https://arxiv.org/abs/1708.02002
提名奖(Honorable mentions)
  • First Person Activity Forecasting with Online Inverse Reinforcement Learning
    作者:Nicholas Rhinehart、Kris M. Kitani
    地址:https://www.cs.cmu.edu/~nrhineha/darko.html
  • Open Set Domain Adaptation
    作者:Pau Panareda Busto、Juergen Gall
    地址:http://pages.iai.uni-bonn.de/gall_juergen/download/jgall_opensetdomain_iccv17.pdf
  • Globally-Optimal Inlier Set Maximisation for Simultaneous Camera Pose and Feature Correspondence
    作者:Dylan Campbell、Lars Petersson、Laurent Kneip、Hongdong Li
    地址:https://arxiv.org/abs/1709.09384

OMT

这次ICCV 2017也有一众中国企业赞助。
白金赞助商包括:百度、滴滴、美图、商汤、腾讯优图。白银赞助商包括:360、中科视拓、北京文安。
活动报名
点击图片阅读原文即可报名参赛和获取更多详情
联想全国高校AI精英挑战赛,面向全国征集优秀AI相关领域技术与应用。此次将在全国8大赛区、260所高校开启项目收集和沟通评判,最终入围总决赛的8支参赛队伍,将获得联想创投投资。
加入社群
量子位AI社群10群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot4入群;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进群请加小助手微信号qbitbot4,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI
վ'ᴗ' ի 追踪AI技术和产品新动态
继续阅读
阅读原文