请输入标题     bcdef
前谷歌数据科学家赛斯·斯蒂芬斯-大卫德维茨在新书《人人都会说谎》中指出,希拉里败选不是因为过度依赖大数据,而是对新的数据统计方式理解太少。他还认为,“大数据具备四种不同寻常的力量”,能够彻底改写微观经济学、社会学、政治学以及计量心理学等学科的研究方式。
请输入标题     abcdefg
大数据近期遭到了不少质疑。希拉里·克林顿败给特朗普后,矛头大多指向了她备受吹捧的数据分析团队,舆论认为他们没能发现中西部各州的警告信号,致使她与总统之位失之交臂。但根据前谷歌数据科学家赛斯·斯蒂芬斯-大卫德维茨(Seth Stephens-Davidowitz)在新书
《人人都会说谎》(Everybody Lies)
中分享的观点,希拉里真正的错误不是对新的数据统计方式太过依赖,而是利用得太少。


希拉里聘用了一流的数字分析人员,但他们的计算大体上仍依赖传统的数据来源,例如选民档案或民意测验。
而斯蒂芬斯-大卫德维茨则选用了一种新颖的数据:谷歌搜索结果。
他特别统计了美国最恶劣的种族歧视字眼“nigger”(“黑鬼”)的查询频率。人们一般认为美国南方才存在公然的种族主义言行,但数据显示,中西部和锈带相对来说更喜欢用这个词。2016年共和党初选期间,在预测哪些地理区域会支持特朗普时,这一变量的影响超出其他所有变量。如果希拉里的团队当初更好地利用了这一信息,也许就能及时推断出她那“蓝色防火墙”的根基正在崩裂。


《人人都会说谎》分享了不少惊人的发现。这本书以搜索数据为向导,为某些普遍的看法提供了数据依据,有些发现则与普遍看法相左。斯蒂芬斯-大卫德维茨不仅给出了非常有趣的实证结果,还提出了一个巧妙的论点:
网络将为社会科学带来一场革命,就像显微镜和望远镜彻底变革了自然科学那样。

《人人都会说谎:大数据、新数据,
以及互联网会如何让我们认清自己》
赛斯·斯蒂芬斯-大卫德维茨著
Everybody Lies: Big Data, New Data, 
and What the Internet Can Tell Us About Who We Really Are.
By Seth Stephens-Davidowitz.
作者乐观而不失理性地提出,“大数据具备四种不同寻常的力量”。信息技术的进步会让人类更加了解自己吗?欢迎登录商论App阅读七月刊文章《真相,全部的真相——还有统计数字》
互动有礼
欢迎在下方“写留言”参与评论
每周留言获赞最多的三位读者将获得奖品
读双语版《经济学人·商论
学会像《经济学人》一样思考
现在订阅全年更可获赠Moleskine笔记本!
点击“阅读原文”,浏览《真相,全部的真相——还有统计数字》
继续阅读
阅读原文