CV 人的大型追星现场来了。
作者 | 黄楠
编辑 | 陈彩娴
又一名 AI 大神有了新动向!
当地时间3月13日下午3点,何恺明在MIT做学术演讲。据现场网友所述,即便自己提前半小时去到现场,但仍挤不进会场,仅排队就拐了几个弯,MIT CSAIL 还临时开了隔壁会议室投屏,许多人是挤在小角落里听完全程的。
据 MIT CSAIL 实验室此前发布公告显示,本次何恺明的演讲主题是 "In Pursuit of Visual Intelligence"(追求视觉智能)。
在现场演讲中,何恺明按时间线顺序回顾其之前的几篇工作,主要包括了 ResNet、Faster R-CNN、Mask R-CNN、MoCo 和 MAE。据何恺明所言,“在 ResNet 出现以前,Deep learning 的大厦上空漂浮着一朵乌云,而 ResNet 去掉了这朵乌云。
此外,何恺明也在现场透露了接下来的研究方向会是 AI for science,将聚焦视觉和 NLP 大一统做 self-supervised X+AI。
会议室爆满(图源:知乎)
MIT CSAIL 隔壁会议室满座图源知乎@睡不醒的芋泥
图源知乎@睡不醒的芋泥
1
何恺明将回归学术界?
何恺明是 CV 领域的翘楚,其谷歌学术被引用次数已经突破40万次,在2022年人工智能全球最具影响力学者榜单中,何恺明获得第一名。
自3月9日何恺明将在 MIT 进行 Job talks(求职演讲)的消息传出后,很快引起 AI 圈的关注。Job talks 是学术界的一个传统,多集中在每年的三四月份进行,申请博士或教职的学者会到高校内做学术报告,演讲内容多为自己的研究成果。
随后杜克大学教授陈怡然也在微博上发声,表示“一直听说何恺明在Market上,靴子终于落了地。”
值得一提的是,如果何恺明确认加入 MIT,那他将会成为全校被引用次数最高的学者。目前 MIT 全校被引用量最高的是化学与生物医学工程系的 Robert Langer,总引用量超过38万次。
有网友表示,何恺明能够进入到 MIT 的 Job talks 阶段,说明他已通过简历筛选,其研究成果和能力上得到 MIT 的认可,但这并不意味着何恺明最终会选择加入 MIT。
2
从高考状元到 CV 大神
何恺明是广东人,从小在广州长大,在广州执信中学读书时曾获得全国物理竞赛和省化学竞赛的一等奖。2003年5月,何恺明获得保送清华的资格,同年他以满分900分的成绩,成为当年广东省9位满分状元之一。进入清华大学以后,何恺明放弃保送的机械工程及其自动化专业转向基础科学班。
2007年,还未毕业的何恺明进入微软亚洲研究院实习,出于对计算机图形图像课程的兴趣,他选择加入了视觉计算组。头两年里,何恺明尝试做过不少各种各样的课题,但一直发不了论文,这对此前头顶着高考满分状元光环的他来说,无疑是个不小的打击。
何恺明花了更多时间在问题研究上,甚至在电脑游戏里找灵感。不鸣则已,一鸣惊人。2009 年,汤晓鸥、何恺明以及孙剑凭借论文“Single Image Haze Removal Using Dark Channel Prior ”,获得该年度 CVPR 的最佳论文奖,这也是该会议 30 年以来第一次(也是唯一一次)颁发给亚洲研究学者。
汤晓鸥(左)和何恺明(右)
2011年,何恺明从香港中文大学多媒体实验室(MMLab)博士毕业,后加入微软亚洲研究院工作;2016年8月,他离开微软亚洲研究院,转而加入 Facebook AI 研究院(FAIR)。
2015年,由何恺明提出的深度残差网络 ResNet ,在 ILSVRC 2015 分类任务竞赛中,首次超越人类水平,斩获竞赛第一名,该工作还拿到了 2016 年 CVPR 最佳论文。
ResNets 也成为计算机视觉领域的流行架构,并被用于机器翻译、语音合成、语音识别和 AlphaGo 的研发上。目前,何恺明谷歌学术被引用量已经超过40万次,其中引用量最高的,也是这篇工作,单篇引用量在2021年底突破10万次,目前已涨至15万次。
在 FAIR 期间,何恺明和团队在计算机视觉领域取得了不少亮眼的成绩,包括 Faster R-CNN、Mask R-CNN 等系列研究。其中,Mask R-CNN 解决了图片中的实例级对象分割问题,不仅能将照片中的人、动物等对象单一检测,还可为其每个对象实例生成一个高质量分隔遮罩,该工作获得了 ICCV 2017 的最佳论文奖。
而在去年火热的 AIGC 领域,何恺明团队在原有的 CLIP 架构基础上,使用掩码方法,不仅实现新模型速度3.7倍的提升,模型性能也得到了一定程度的优化。
3
离开大厂的 AI 大牛再添一员
事实上,早在去年 Meta 第一波裁员时,就有消息传出何恺明也在被裁名单中,但彼时阿里巴巴副总裁贾扬清在相关知乎问题下对这一消息进行了否认。
何恺明所在的 Facebook AI Research 自去年以来,已经发生过几次重大调整。
其中,图灵奖得主杨立昆(Yann LeCun)负责基础研究,Jerome Pesenti 负责管理整理 AI 部门的技术、产品赋能、运营等工作。但自2022年6月开始,FAIR 被并入至元宇宙部门Reality Labs,杨立昆转向该部门的首席科学家 Andrew Bosworth 汇报。
后续的调整也是围绕“去中心化组织结构”进行,重点在削减对基础研究的投入。
可以看到,即便如 Facebook 这样的巨头在整体预算整体收缩之际,AI 研究院率先面临了被边缘化的困局。
预算缩减、人心涣散,直接导致了优秀人才的离职频发。这些离开的 AI 大牛有两条发展路径:一是从工业界回到学术界,二是从大厂离开、自己创业,担任CEO或CTO等要职,并持续从风险投资人处成功获得融资。
就在半月前,亚马逊机器学习部门原杰出科学家/VP Alex Smola 与首席科学家李沐师徒二人离职,进军大模型方向创业,此次何恺明前往 MIT 面试教职的消息,也再次引发外界对大厂 AI 实验室和 AI 人员的讨论和思考。
参考链接:
1.https://www.csail.mit.edu/event/eecs-special-seminar-kaiming-he-pursuit-visual-intelligence
2.https://www.zhihu.com/question/588205714
更多内容,点击下方关注:

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

继续阅读
阅读原文