剑桥大学苏熠暄:基于对比学习的文本生成框架
平均阅读时长为 59分钟

(
机器学习算法与自然语言处理
)是国内外知名自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
MLNLP学术Talk是MLNLP社区举办的学术交流活动,旨在邀请一线青年学者分享最前沿的技术,期待最精彩的思想火花碰撞。本次MLNLP学术Talk特别邀请了剑桥大学三年级博士生苏熠暄为我们带来“基于对比学习的文本生成框架”的主题报告,由哈尔滨工业大学硕士生、MLNLP社区秘书魏福煊主持。
报告的详细信息如下:
1
『讲者介绍』
苏熠暄,剑桥大学三年级博士生,导师为Nigel Collier教授,在此之前他于剑桥大学获得硕士学位,于北京理工大学获得本科学位。他的研究关注于文本生成,大规模语言模型,以及表征学习。到目前为止,他已与ACL, EMNLP, NAACL,EACL等会议上发表十余篇论文。个人主页:https://yxuansu.github.io/
2
『报告摘要』
基于预训练语言模型的文本生成在许多自然语言处理应用中是十分重要的组成部分。然而,直接使用最大化的解码方法(例如Beam Search)通常会导致文本退化的现象---生成的文本不自然并且包含重复。现有的解决方案通常使用sampling的解码方式或者使用unlikelihood的训练目标来训练语言模型。然而,这些解决方案仍然会导致生成的结果不连贯以及不通顺。在我们最新的工作中,我们分析语言模型表示空间的各向同质性是文本退化的一个潜在原因。就此,我们提出了一个基于对比学习的解决框架: (1)一个基于对比学习的训练目标函数---SimCTG以及(2)一个新的解码策略---Contrastive Search。我们在来自两个语言的三个标准数据集上做了大量的实验。实验结果表明我们的方法在人工以及自动指标上大幅超越目前已有的方法。
3
『主持人简介』
魏福煊,哈尔滨工业大学硕士,MLNLP社区秘书处成员。研究兴趣为任务型对话系统、口语语言理解与自然语言处理。在多个国际会议期刊ACL/TALLIP等参与发表相关论文。
关于我们
关键词
自然语言处理
报告
论文
方法
语言模型
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。