点击上方“蓝字”关注“AI开发者”

近日在 kaggle 官网上,谷歌云与美国大学生体育协会(NCAA)再一次联合推出「疯狂三月」篮球冠军预测大赛。
任何开发者只要能够通过 AI 来预测 NCAA「疯狂三月篮球赛」的冠军,就有机会获得由 Google 提供的$25,000 高额奖金。当然,该比赛属于 Kaggle 上最著名的 Featured 比赛类型,难度可不低。
图片来源:DiAnte Squire on Unsplash

关于 Kaggle 竞赛

相信大部分开发者都对 Kaggle 并不陌生,这是全球顶级的权威性数据科学竞赛平台,为全世界的数据科学和机器学习的爱好者、研究者和创业者提供了公平公正的竞赛平台。
不论你是数据科学小白,还是数据科学高手,在 kaggle 上都可以收获到自己想要的知识、技巧、经验、荣誉,或是高额奖金。
kaggle 官网主页
针对基础入门参赛者,通常可以在 Started 类型比赛中,学习初学者项目以及积攒经验;而针对高级数据科学玩家,高额奖金的 Featured 类型比赛,或者实验研究为主的 Research 类型比赛,都是不错的选择。
除此之外,想招募合适人才的公司,也可在 kaggle 平台上发表需求相关性强的 Recruitment 类型比赛。当然,平台上也有少量超高难度的 Masters 类型比赛,适合大师级别人物参加。
Kaggle 官网地址:
https://www.kaggle.com/

「疯狂三月」,将 ML 用于 NCAA 篮球赛冠军预测

每年三月,有一项赛事将吸引全世界篮球迷的眼光,那就是 NCAA 的疯狂三月。NCAA 男子篮球联赛分为三个级别,疯狂三月是 NCAA 男子篮球第一级别联赛锦标赛,也就是季后赛,采用单场淘汰制。因而结合其每年在三月进行的时间特点,这一比赛获得了「疯狂三月」的称号。
作为如此大型的赛事,比赛最终的冠军当然也是饱受关注。自 AI 迅速发展以来,研究学者们就一直希望能够通过对大数据的科学分析,在金融、医疗、股市甚至偶然性极强的竞技赛事中获得准确的预测结果。而谷歌云与 NCAA 联合举办的「疯狂三月」篮球冠军 AI 预测大赛,也正是希望将数据科学与赛事预测完美结合,更好的发展数据科学领域。
本次比赛要求参赛者具有较高的数据科学研究水平,同时也提供了较高的奖金,属于 Featured 类型的竞赛。比赛分为了两个阶段,在第一阶段内,参赛者可根据历史数据构建和测试模型,这一阶段不计入最终得分,截止日期为 3 月 14 日;而进入第二阶段后,参赛者所提交结果将计入最终得分,并在 3 月 19 日前(格林尼治标准时间)需提交 2020 赛事最终预测结果。当然,选手也可跳过一阶段直接进入二阶段。
数据分析图表
但值得注意的是,「疯狂三月」之所以让球迷们极度疯狂,其紧张激烈的淘汰赛制也是其中非常重要的原因之一。不同于常见的淘汰模式,该篮球赛形式采用的是「突然死亡法」——WIN OR GO HOME,也就「一场定胜负」。因此,即使是 NBA 巨星,如果在一场比赛中表现不佳,同样会被淘汰出局,彻底无缘冠军争夺。正是这样的赛制,也大大增加了结果预测的难度。
不过简而言之,参与 AI 预测大赛的获奖规则即:参赛者通过出题方给予的训练集(包括:男篮与女篮.CSV 类型的文本数据集)建立模型,再利用测试集准确预测出本次篮球赛的详细结果。
篮球场建模示例
同时,Kaggle 团队将在「疯狂三月」整个篮球赛赛中刷新排行榜,最终排名前五参赛者将依次获得:第一名$ 10,000、第二名$ 7,000、第三名$ 5,000、第四名$ 2,000、第五名$ 1,000 的奖金。
「疯狂三月」篮球冠军预测大赛地址:
https://www.kaggle.com/c/google-cloud-ncaa-march-madness-2020-division-1-mens-tournament

数据预测未来发展

目前,在比赛官网上已陆陆续续有一些通用代码、EDA(电子设计自动化)以及其它预测模型相关的文章发布,并向数据科学爱好者们提供了解读。其中,Rmarkdown 向我们详细展示了本次大赛介绍、赛前准备、使用数据以及预测规则等,而一些在数据科学领域还不够老练的开发者,也可以从中获益良多。
图片来源:NCAA 官方网站
在过去几年人工智能还未取得较快发展的时候,已经出现了众多采用大数据分析的方法,来对未来的一些结果进行预测,包括:股市、赛况、交易等领域,同时取得了较为科学准确的结果。
而现如今人工智能(AI)领域的快速发展,可以预见的是,数据科学也将对社会带来更大的影响,甚至一些学者认为,它将驱动经济增长,为改善生活质量带来更多机会。
尽管我们暂时无法验证数据科学发展的最终结果是好是坏,但对于 AI 预测这一功能的实力,依旧值得我们重视并加以利用。而这些具有商业意义的 AI 竞赛,更是我们将技术与理论落地的极佳实践环境。在今后的日子里,我们也将持续报道更多相关赛事,期待你的关注。
Kaggle 官网详细方案解读:
https://www.kaggle.com/headsortails/jump-shot-to-conclusions-march-madness-eda  
近期AAAI 2020系列论文解读公开课
AAAI 2020丨滴滴:用于异质结构化学习的基于注意力的图神经网络【长按左侧图片扫码观看】
AAAI 2020丨AutoCompress:一个为超高压缩率设计的自动深度神经网络架构的剪枝框架【长按右侧图片扫码观看
点击 阅读原文,查看:Kaggle参赛入门经验
继续阅读
阅读原文