今天解析一下Kaggle最新比赛:自动论文评分竞赛2.0——Learning Agency Lab - Automated Essay Scoring 2.0。文末有图书抽奖活动!
本次比赛类型是自然语言处理NLP。目标是训练一个模型来为学生论文评分
本次比赛能帮助大家熟练使用bert等预训练语言模型。比赛4月初刚开始,难度适中,适合所有从事NLP相关工作的同学参加。
有关本次比赛的baseline详解,我邀请了美国TOP20毕业的William老师开了一场讲座。William老师经验丰富,曾带领20+学员斩获Kaggle金牌
baseline讲座为福利性质,只需0.01元。并赠送500+Kaggle金牌方案扫码即可领取!
扫码看讲座、领资料、包邮抽图书(文末详情)
赛题讲座
数据集介绍
竞赛数据集包含约24000篇学生撰写的议论性文章。
train.csv - 作为训练数据使用的文章和得分。
  • essay_id - 文章的唯一ID
  • full_text - 完整的文章内容
  • score - 文章的整体得分,范围为1到6
test.csv - 作为测试数据使用的文章。包含与train.csv相同的字段,除了排除了score。
  • sample_submission.csv - 符合正确格式的提交文件。
  • essay_id - 文章的唯一ID
  • score - 文章的预测整体得分,范围为1到6
数据样例:
label分布:
扫码看讲座、领资料、包邮抽图书(文末详情)
500+Kaggle金牌方案
我整理了2023年10场比赛54个金牌方案,CV与NLP方向都有。此外,还有过去几年470场金牌方案。今天分享给大家下载。
扫码看讲座、领资料、包邮抽图书(文末详情)
包邮赠书福利
扫描下方二维码,凭当前文章截图参与抽奖。抽取10名同学,包邮送出《机器学习算法竞赛实战》图书将在月末统一寄出,感谢同学们的耐心等待。
扫码看讲座、领资料、包邮抽图书
继续阅读
阅读原文