By 超神经
场景描述:用数据挖掘、机器学习、自然语言处理等方法,对电影票房进行预测,为制片方、发行商、投资者以及影院提供参考与指导作用。
关键词:数据挖掘 机器学习 自然语言处理 票房预测
复仇者联盟迎来了最终之战。
此次最先在中国上映的举动也让不少欧美粉丝掩面哭泣,而周三凌晨的首映更是经历了一票难求,甚至是重金难求。还有铁粉花数百元顶着要早起的压力购买了周三早晨 7 点的票……
预售火爆,人肉预测最终票房30 亿美元
据猫眼电影统计,《复仇者联盟 4:终局之战》预售到今日已经突破 6 亿,首日观影人数近 300 万,刷新了影史预售纪录。
万众瞩目的《复联 4 》被预测最终票房会达到 30 亿美元。漫威迷们已经迫不及待地加入火热探讨:
知乎网友普遍人工预测《复联 4》最终全球票房会达到 30 亿
之前《复联 3 》最终的全球票房惊人,超过了 20 亿美元,排行影史第四。如今复联的结局看起来势头很猛,甚至会超过上一部。
目前根据国外专业票房预测网站的数据显示,《复联 4》的首周末票房将会高达 2.5 亿至 2.9 亿美元,如果达到平均值 2.65 亿美元的话,就会超越前作(2.577 亿美元)成为北美影史首周末票房冠军。
国外网友也纷纷人工预测上映前三天会达 10 亿美元,最终全球票房会超过目前排行榜第一名《阿凡达》(最终全球票房 27.87 亿美元)。
机器学习会看剧本预测票房 
若要论其票房预测,估计最资深的人士,也难以准确预测,毕竟涉及的因素众多,但交给人工智能来做,也许就有意想不到的结果。
一家总部位于以色列的 AI 公司 Vault ,是使用分析和算法预测票房的最新参与者之一。从 2015 年起,他们就致力于通过神经网络算法,花了两年时间,对过去 30 年的票房数据、近 40 万件剧本,电影预算、整体观众数量以及演员信息等进行数据分析,用于估算新电影上映首周的票房。
Vault 的产品包括 4CAST 平台以及深度观众分析
其创始人兼 CEO David Stiff 介绍说,公司的 4CAST 平台能够只从原始剧本或电影预告片中,收集到的「核心故事 DNA」来分析电影的票房潜力。
他还表示,如今他们的 AI 系统在电影票房预测上,准确率能达到 75% 左右,非常接近实际票房。在公司成立之初该程序在预测电影票房方面的准确度达到 65%~70% 。
根据 Box Office Mojo 的说法,该公司预测科幻惊悚片 《异星觉醒》的首映票房为 1,610 万美元,实际上为 1,250 万美元。
另一家叫做 ScriptBook 的 AI 公司, 准确地「预测」出了 2015-2017 年间索尼家出的 32 部「票房毒药」中的 22 部。
ScriptBook 的依据是,将剧本的 PDF 文件上传到系统中,几分钟后对项目进行详细分析,其中包括:
预测 MPAA 评级,分析其特征,检测主角和对手; 评估每个角色的情绪; 预测目标受众,包括性别和种族; 而且,最重要的是,作出票房预测。
这种评测背后基于快速发展的机器学习,软件首先由人类指导,然后接管学习过程,并构建以惊人速度开采的大型数据库。Ruelens 说,ScriptBook 的软件已在 6,500 个现有脚本的大型数据集上「受过训练」。
票房预测准确与否,对谁影响最大

话说回来,AI 对票房的预测会靠谱吗?
总的来说,票房预测系统大多基于大数据。仔细研究,会发现机器学习预测票房的行为,依赖的是数据,消费者行为,剧本消息等行为的分析整合。
ScriptBook 官网给出的其预测依据为数据挖掘+机器学习+自然语言处理+特色工程
所以对于意外的因素,比如「我不是药神」的火爆,以及「银翼杀手 2019 」的惨淡,都是难以把控的。
这么说来,对于剧情保密工作做得严实的「复联 4 」,想要准确预测估计有些难度。不知道计算的时候,会不会计量中国漫威粉丝的信仰充值。
即便如此,票房预测对于电影市场来说,还是有很大的参考价值。
某电影票房预测平台已对明天上映的《复联 4》作出预测
对于电影创作起到指导作用。比如,某主演对该电影的票房贡献大小,有无必要拍成3D,观众期待的结局等。
片方通过对电影预算成本、制作过程、影片内容、上映档期等作相应调整,将投资风险控制到最小。
此外,对发行方而言,能对电影发行、营销等各个环节进行合理优化,规避电影运作过程中的各种不利因素。而对影院来说,则能依据预测合理部署排情况。
猜一猜,《复联 4》 最终全球票房会是多少?我赌 30 亿美元,你呢?
超神经百科
α-β 剪枝 Alpha-beta pruning
α-β 剪枝是一种搜索算法,用以减少极小化极大算法(Minimax 算法)搜索树的节点数。
常用来裁剪搜索树中没有意义的不需要搜索的树枝,以提高运算速度。
Alpha-beta 剪枝是一种对抗性搜索算法,当算法评估出某策略的后续发展比之前策略的差时,就会停止计算该策略的后续发展。
该算法和极小化极大算法所得结论相同,但剪去了不影响最终决定的分枝,进而提高了效率,减少了计算量。
历史文章(点击图片阅读)
复联还没下档,AI 已经等不及要推荐新电影了
清华博士带你解读漫威电影的「量子世界」
龙妈苟活还是凉凉,预测算法哪家准?
AI 百科
教程
数据集
商店
更多
http://hyper.ai
继续阅读
阅读原文