麻省理工学院@王柏林:《Latent Discrete Structures for Sequence Modelling》
(
机器学习算法与自然语言处理)是国内外最大的自然语言处理社区之一,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
6月26日北京时间早上09:05-09:45,麻省理工学院@王柏林为大家带来《Latent Discrete Structures for Sequence Modelling》报告。欢迎大家报名观看。
报告摘要
序列模型在自然语言处理中有广泛的使用,主要应用任务包括机器翻译,语义分析。当前的序列模型虽然能够在数据分布一致的时候取得很好的泛化能力,但是在分布外的泛化能力非常弱。相比之下,人是可以从很少的数据中实现系统性的泛化能力,即使是对于分布外的数据。在语言处理的传统工作中,引入语法规则是实现系统性泛化很好的解决办法,但是语法规则需要标注,并不适用于实际场景。我们探索如何引入隐结构到序列模型中,让模型能从数据中,端到端地学习到语法规则相似的规律,从而帮助序列模型实现和人更接近的系统性泛化能力。
讲者介绍
王柏林,麻省理工学院博士后,博士毕业于爱丁堡大学,导师为Ivan和Mirella。主要研究方向为隐变量模型,语义分析,结构化预测,现在的主要研究兴趣是在大型模型中引入结构化信息帮助语言建模。博士期间在国际顶尖会议发表多篇工作。个人主页: https://berlino.github.io/
关于我们
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。