面向表格数据的大模型推理综述
社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
转载自 | 哈工大SCIR
作者 | 张玄靓 王丁子睿
1.介绍
2. 背景
2.1. 任务定义
2.2. 相关数据集
表格问答:WikiTableQuestions[3]数据集作为第一个表格问答类的数据集,由于其开放域的表格和复杂的查询问题,使得该数据集能够充分验证模型的表格问答能力; 表格事实验证:TabFact[6]数据集作为第一个表格事实验证类的数据集,其大规模跨领域的表格数据和复杂的推理需求,可以有效检验模型在表格事实验证任务上的能力; table-to-text:ToTTo[7]数据集通过高亮特定的表格内容生成相关描述,因其大规模高质量的表格数据及对应描述能很好地验证模型的table-to-text能力,而成为table-to-text任务的主流数据集; text-to-SQL:Spider[8]是第一个text-to-SQL任务上多领域、多表格的数据集,在text-to-SQL任务上被广泛使用。
3. 前沿进展
3.1. 有监督微调
3.2. 模块化分解
3.3. 上下文学习
3.4. 使用工具
3.5. 提高鲁棒性
4. 未来方向
4.1. 有监督微调
4.2. 模块化分解
4.3. 上下文学习
4.4. 使用工具
4.5. 提高鲁棒性
5. 总结
参考文献
扫描二维码添加小助手微信
关于我们
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。