AAAI 2020 | 云从科技&上交大提出 DCMN+ 模型，在多项阅读理解数据集上成绩领先

机器之心发布

机器之心编辑部

2020 年 2 月 7 日-2 月 12 日，AAAI 2020 将于美国纽约举办。不久之前，大会官方公布了今年的论文收录信息：收到 8800 篇提交论文，评审了 7737 篇，接收 1591 篇，接收率 20.6%。本文介绍了由云从科技与上海交大合作的论文《DCMN+: Dual Co-Matching Network for Multi-choice Reading Comprehension》。

链接：https://arxiv.org/pdf/1908.11511.pdf

在那些寒窗苦读的学生时代，你一定碰见过阅读理解，它需要融会贯通进行主观陈述和作答，是让无数考生头疼的题目。继智能系统在围棋、国际象棋、游戏等领域超越人类后，「阅读理解」也成为了机器的「苦恼」。

在此 AAAI 2020 论文中，云从科技和上海交大针对 RACE 多项选择题提出增强的 DCMN+模型。

据介绍，DCMN+是年初论文作者们提出的 DCMN 增强模型，针对多项选择型机器阅读理解，以大规模预训练模型（如 BERT 等）作为前端编码器，在多个多项选择型机器阅读理解任务（如卡耐基梅隆大学的 RACE）上取得了最先进的水平，另外 DCMN 也适用于其他简单分类任务。

与其他技术相比，其显著特征是双向匹配策略，其他现有模型的匹配策略都是单向的，比如在文章-问题（P-Q）建模时，现有技术只有问题（Q）在文章（P）上的映射匹配，没有文章（P）在问题（Q）上的映射匹配，而 DCMN 则集成了两个方向的匹配信息。此外，还集成了文章中句子筛选-从文章（P）中筛选出与问题相关的句子用于推理，答案选项交互-引入选项之间比较信息两种阅读策略，进一步提升了模型的性能。

以下是对此论文的技术解读。

1 任务描述

本文主要聚焦多项选择型机器阅读理解，它的形式类似于英语考试中的阅读理解（选择题），给定一篇文章，通过阅读并理解文章（Passage），针对提出的问题（Question）从选项中选择正确的答案（Answers）。其中典型的数据集是卡内基-梅隆大学发起的大型深层阅读理解任务数据集 RACE（ReAding Comprehension dataset collected from English Examinations），它来源于中学考试题目的大规模阅读理解数据集，包含了大约 28000 个文章以及近 100000 个问题。除了 RACE，我们还在 SemEval-2018 Task11, ROCStories，MCTest 以及 COIN Task1 等类似多项选择型数据集上测试了我们的模型。