NLP 领域还有 5 大开放问题
作者 | 杨晓凡
编辑 | 唐里
如题,虽然 NLP 研究领域已经在深度学习的帮助下取得了长足的发展,许多技术也已经商业化落地,但我们也需要知道,这个领域还有几个开放性问题等待解决 —— 如果它们也能比较好地解决,也许我们能迎来 NLP 科研成果与商业落地的一个新的高潮。
5. 评价指标
这个问题在领域内不算很大的瓶颈,但是经常有研究人员觉得有必要重新讨论这个问题,因为现行惯例里往往不问原因就沿用某些固定的架构、数据集和评价指标。有人这样总结:「随着我们探索越来越高级的认知任务,弄明白为什么某些方法、某些架构在某些时候能起到好的效果,这对我们非常有帮助。」
4. 终生学习(Life long learning)
NLP 领域遇到的另一个棘手问题是为这几个问题设计解决方案:
- 低阶模型用于下游任务时的终生适配
- 迁移学习的应用
- 视觉、文本、音频等等语言相关模态的无缝整合
- 低资源情境中高效的跨任务迁移
3. 面向目标的对话系统
从 ACL 学会出版的论文集来看,近一两年的 ACL 会议、EMNLP 会议中研究面向目标的对话系统的论文都有大幅增加。这就是又一个开放性问题:如何设计具备常识、能在真实世界语境中与人类进行较长的、面向目标的交谈的机器对话系统。目前的研究思路包括:带有状态追踪的任务驱动的对话系统,使用强化学习的对话系统,以及很多别的新点子。
拓展阅读:在 NLP 中应用强化学习
https://www.csie.ntu.edu.tw/~yvchen/doc/KAIST19_Tutorial.pdf
2. 低资源语言
这可以算是最紧迫的问题。目前全世界大约有 7000 种语言,但这些语言中只有很小的一部分,大概 20 种左右,可以算是资源丰富的语言。这个问题除了很实际之外,在其中找到灵感、取得进展也相对比较容易。专家们认为可行的方向包括:
- 为低资源语言设计收集数据、用较小数据训练语言模型的方法
- 可以有效用于低资源语言的跨任务迁移方法
1. 自然语言理解
没错,这就是那个最开放的问题,它和 NLP 领域中的许多具体问题也都息息相关。想要解决这个高阶的认知问题,可能需要我们从强化学习、领域适应、小样本/零样本学习等等领域中借鉴很多思想和方法,也还需要 NLP 研究人员们做出更多创新。
- 共指消歧(Coreference resolution)、多义词解析(Polysemy)、文本/文档总结(Text/Document Summarization)
- 论证与推理,讽刺与幽默
- 高效地表征大文本
- 环境中的语言学习(Grounded language learning),比如联合学习一个世界模型和语言模型,并且学习如何在语言模型中使用世界模型。
2. 巴赫涂鸦创作者 Anna Huang 现身上海,倾情讲解「音乐生成」两大算法
3. 一份完全解读:是什么使神经网络变成图神经网络?
点击阅读原文 加入 NLP 论文讨论小组
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。