作者:梦佳,一鸣
编辑:琰琰
原定于泰国曼谷举行的 ACL-IJCNLP 2021 于 8月2日在线正式开幕。本届会议由中科院自动化所研究员宗成庆担任ACL2021 大会主席,程序主席为来自罗马大学的Roberto Navigli、华盛顿大学的夏飞教授(Fei Xia)和香港理工大学的李文捷(Wenjie Li)教授。

1
ACL盘点

本次 ACL 大会共提交了 3350篇文章,相较于去年的 3429 篇投稿似乎有所回落。这某种程度上也显示了 AI 的热潮正在回归理性。
在3000+的投稿论文中,有 710 篇普通论文被录用(其中 571篇长文本,139篇短文本)。除此之外,另有 493 篇论文被录用为 Findings paper。
根据程序主席Roberto Nabigli的介绍,今年主会论文的接收率为21.2%,并额外接收了14.7%的论文到Findings子刊。
整体来看,ACL录用率保持在20%~25%之间,没有太大变化;其中长文章录用率基本维持在25%左右,短文章录用率则逐年下降。这表明,ACL大会似乎越来越不喜欢「尚未完成但是已经有了一点成果的工作,或者是得到负面结果的工作」。
Roberto讲到,Findings机制指的是有些论文虽然没有被主会所接收,但工作依然很扎实,有一定的质量和创新性,因而被接收为Findings论文。其中共邀请了493篇论文为Findings论文,有457篇论文作者接受了邀请。
在领域方面,有领域主题的名称有所调整,一些领域进行了融合,如「Semantics: Sentence Level」和「Semantics: Textual Inference and Other Areas of Semantics」整合到了一起。
增加了「NLP for Social Good」这个子主题,该子主题下共有36篇投稿。 
所有收录论文所属的领域,前五名的主题和2020年相同,分别为机器学习、机器翻译和多语言、信息抽取、对话系统、NLP应用和句法分析。
在投稿国家方面,本届大会上共有57个国家投稿,其中投稿数前二国家是中国(37.6%)和美国(25.1%),其中中国投稿量是美国的1.5倍之多。
从投稿关注的领域上,今年和2018年有很大区别。3年前,CNN等是研究者关注的重点,但本届大会上最受关注的研究是预训练语言模型,包括BERT、RoBERTa、BART、GPT-2等。
大会还推出了一个用于搜索论文、作者、研究方向等的工具,名为semantic path工具。工具地址:acl.semanticpaths.org。
大会还公布了其他一些数据,例如,在ACL会员方面,ACL已成为人工智能领域最重要的会议之一。从会员数量来看,2020年ACL会员数量超过6000。
以下是本届大会的最佳论文,最佳论文的发布环节在8月4日。
一共会有三场主旨演讲,值得期待。

2
规模最大审稿团队

本届会议组委会堪称历届会议中规模最大的团队,共设置了19个子委员会,共68个共同主席。
夏飞教授则介绍了审稿的具体流程。ACL今年推出了新机制——ACL Rolling Review,适用于所有 ACL 系列会议和 Workshop 的投稿与审稿流程,在EMNLP得到应用。
审稿方面,本次大会的组委会是历届ACL大会中规模最庞大的一次。大会设立了3个程序主席,负责大会的人员招募、流程制定、议程设置等工作,并决定最终接收的论文。 
此外,大会招募了60名高级领域主席(SAC),负责招募领域主席、选择审稿人、提名最佳论文和杰出论文等工作。
在领域主席之下是323名领域主席,负责招募审稿人、提名最佳论文和接触论文,撰写评审结果,最初初步提名的工作。大会同时招募了3600多名初级审稿人和260多名高级审稿人,每人负责审阅1-6篇投稿。
值得注意的是,本届大会专门设置了伦理顾问委员会(EAC),其中包括3位主席和56名审稿人。伦理顾问委员会的主要职责是审查论文的社会和伦理问题。在EAC的审核中,247篇论文可能存在问题,其中28篇经过修改后有条件接收。
最佳论文的评审中,候选论文由领域主席和高级主席提名,并由程序委员们提出最终的提名名单。本届大会上,入围提名的有25篇长论文和3篇短论文。最终,最佳论文评选委员会从提名论文中选出了1篇最佳论文和6篇杰出论文。
此外,每个主题赛道(Theme Track)都会选出最佳主题论文,由高级领域主席选出。 

3
关注社会、伦理、教育

本届大会上,密歇根大学的Rada Mihalcea教授介绍了ACL组委会近来在推动组织发展方面的工作,以及当前NLP领域的研究趋势和热点问题。
在社会责任方面,ACL已设立了ACL 平等主管一职。主要负责推动多样性、包容性等方面的工作,如推动更为安全和包容的环境等。
在伦理方面,ACL 伦理委员会将会提供一个持续的平台,解决ACL活动和社区提出的伦理问题,并为伦理研究提供指导和解决方案,支撑AI伦理方面的研究。ACL伦理委员会由3名共同主席担任,任期五年,委员会同时将会有6名成员,任期3年。伦理委员会将会确保AACL(亚洲计算语言协会)、EACL(欧洲计算语言协会)和NAACL(北美计算语言协会)都会得到同样的指导。
ACL同时也在加强和高校学生的互动工作,本届大会上,ACL提出了Year-Round Mentorship机制,通过一年的虚拟指导,为学生入门AI领域提供支持。导师来自学术界或在计算语言学领域有关键影响的工业界专家。
学生在研究过程可以获得研究方面的指导,如开题、写论文、是否读博等。目前注册通道已开放。

4
研究热点及趋势

Mihalcea也介绍了ACL近年来NLP领域的研究热点和趋势,并进行了分析。 
研究趋势方面,本届ACL的研究可以看到对人工智能在应用和社会发展中的关注,当前这一领域的热门研究内容包括:对话、语言和视觉、计算社会科学、常识、NLP中的伦理问题(隐私安全)等。
从近几年的研究来看,采用词云统计,有关word embeddings的论文数量快速上升。
在研究关注的领域方面,虽然以往的研究者主要关注的是模型的accuracy,但现在研究人员已经开始转向整个AI系统的表现,关注系统准确性。
对此,Mihalcea呼吁,研究者不要仅关注SOTA结果,盲目追求系统准确性。她列举了很多研究者需要关注的问题,如可解释性、泛化性等。
可解释性方面,人们需要更透明,更容易用的系统来解决可解释性的问题。研究者需要解答的问题是,「我们到底从这些神经网络当中能够学到什么?」一个可以参考的链接是 http://blackboxnlp.github.io/
除了准确性之外,研究者还要关注算法的泛化性问题,在一个域中训练的网络往往无法迁移到其他域中,或者说很难通过少量的数据就完成迁移。此外,所谓的领域内(in-domain)到底是指什么意思(同一个主题/同一风格/同一级别的形式)?
她举了语种作为例子,英语语言模型的能力很难迁移到世界上更广泛的语言中。解决这个问题可以参考的文章题为NLP beyond English( http://ruder.io/nlp-beyond-english/)
研究者也需要关注AI伦理问题。这就是为什么ACL采纳了美国计算机协会的伦理准则,成立了ACL伦理委员会。
NLP的社会影响方面,Mihalcea认为有很多AI研究具有社会影响,应当予以关注。根据ACL的一项调查,47.5%的人认为,从长期来讲,NLP对于解决某些社会问题是有益处的。30.5%的人认为,NLP在长期来讲在解决大量社会问题方面可以起到关键性作用。
Mihalcea认为,这项调查说明,能够带来潜在社会影响的NLP任务包括,低资源情况下的机器翻译;机器辅助技术;信息的收集和处理(比如自然语言理解、总结、信息检索、问答);心理健康,发现仇恨言论;扼制错误信息的传播。
演讲最后,Mihalcea提到了AI对环境的影响,以及可能带来的垄断问题。她认为,随着超大规模预训练模型成为NLP领域的研究热点,研究人员需要关注训练模型带来的环境影响,减少碳排放等负面效应。
同时,训练大模型的成本非常高昂,研究者需要警惕AI垄断(AI Monoploy)的问题。因为只有大企业、大机构才有能力去研发和训练大模型。
扫码加入ACL2021交流群:
若二维码过期或群内满200人时,添加小助手微信(AIyanxishe3),备注ACL2021拉你进群。

由于微信公众号试行乱序推送,您可能不再能准时收到AI科技评论的推送。为了第一时间收到AI科技评论的报道, 请将“AI科技评论”设为星标账号,以及常点文末右下角的“在看”。

继续阅读
阅读原文