1
2019年4月,微博用户 @尹立庆 通过对阿里「双十一」10年来的交易额数据进行分析,认为阿里双十一的销售额存在「造假」嫌疑,并对2019年「双十一」交易额进行预测,他的预测值为2689亿元。
令人大跌眼镜的是,2019年「双十一」的官宣成交额为 2684 亿元,竟然和  @尹立庆 的预测值仅差5亿元,误差仅为千分之1.8!
其实,他的预测方法很简单:
他将过去10年的「双十一」单日成交额做了拟合,得出一条函数曲线。而神奇的是,历史上的10个「双十一」成交额,竟然完美分布于这条曲线上,其拟合度高达99.96%!
我用 Python 还原了分析全过程,得出了相同的结论。有兴趣的朋友可以自己试试看。

这就很奇怪了。
如果说,对长期的宏观数据进行拟合并得出一个精度极高的预测(例如预测上市公司年报业绩、预测人口增长速度等等)尚且可能的话,对短期(单日)微观(单个促销活动)进行拟合后、得出如此精准的预测,在自然发生的经济现象中几乎是不可能的,遑论将预测误差维持在千分之2以内呢?
换一个思路,即便我们删掉最近几年的「双十一」成交数据数据,仅以2010年-2014年的「双十一」成交额进行同样的拟合和预测,依然能计算得到2019年的预测销售额为2594亿元,与真实数据的误差仅为3.5%!
这与「预测周期越远、误差越大」的统计常识完全相反。
难道仅凭几个零散数据,就能极其精准的预测到多年后的真实情况吗?
唯一的可能性,就是这个数据本身受到了人为操控。
这条完美曲线,并非天然生成,而是人工绘制的。
2
在数据面前,我们能看到,阿里「双十一」的销售额曲线绝不可能天然形成。而阿里开始人为操控销售额的时间点,应该可以拉到第三四次甚至第二次「双十一」。
不过,有人据此得出「阿里双十一数据造假」的结论,我认为为时过早。
造假意味着交易额并非真实存在,而我所说「人为操纵」的意思,是阿里很可能在有意识的将销售额控制在这个精心设定的点位上。
况且,阿里其实并不需要「造假」。
熟悉电商平台的朋友,可能很容易理解,以阿里多年对电商、流量、和运营的理解把控,完全可以极其精准的控制住整体销售额。
某件商品销量不行?多给资源,就能一飞冲天。
店铺的卖货效率有高有低?将更多曝光机会给予大型品牌商,创造更多的爆点。
平台整体销量如果达不到预期?大范围发放更有力度的优惠券,促进买家「剁手」。
阿里对「双十一」交易额的控制,并不需要造假,仅仅需要实时监控、调配资源,就像操纵提线木偶一样,足以将整场活动的节奏牢牢把控在自己手中。
3
「人为操控数据」的现象已经浮出水面,我们还要追问一句——为什么要操纵「双十一」数据?
「双十一」之于阿里,相当于整个阿里集团的奥运会。在电商运营、前后端技术、物流、支付、安全、金融等等层面,都是一场极为庞大的「压力测试」,同时也是对一年来工作成果的集中展示。
能牢牢控场「双十一」,意味着一年辛苦没白费,意味着一线员工们的 KPI 有了保障。一个早已定好的交易额,就像一个靶子,既不能偏左,也不能偏右,最好的状态就是「刚好命中靶心」。这个销售额,不能无限制的拔高。企业要发展,但最好是稳定的发展。
「一切都很稳」,这就是最重要的事情。
除此以外,稳定的、可预测的交易额,同样会减少「峰值」期间电商生态下的其他行业的压力。最明显的就是物流。例如,如果交易额可以被精确预测,那么物流企业也可以精准的预测物流压力,从而提前布局、降低风险。
总之,一切都是在商言商。
然而,作为消费者的我,有一种被耍了的感觉。
既然每年「双十一」交易额都在官方预料之中,那么各类「庆功会」和新闻表功,岂非就成了糊弄消费者的闹剧?你们既然早已知道结果,那么全场唯一还蒙在鼓里的,就只剩下我们吗?
对于阿里而言,把控「双十一」交易额或许是一种刚需。我却因此产生了一股深深的不信任感。
4
让我们把话题拉回到「双十一」的数据预测。
根据 @尹立庆 的数据分析,2020年「双十一」销售额将达到3301亿元
3301亿元」这个数据,在被大家计算出的那一刻,就成了「第22条军规」:
如果2020年「双十一」真的是这个数字,那么进一步坐实了「阿里操纵交易数据」的事实;
如果2020年「双十一」并非这个数字(无论明显高于还是低于它),在这个拟合函数上,都是一个明显的异常值,显得阿里在刻意回避这个数字。
现在回头望去,无论是无比复杂的折扣规则、奇葩的「当日不可退货」政策、还是变幻莫测的红包使用条件,似乎都在充当着「双十一」交易额的「稳定剂」。
皇帝的新衣一被掀开,剩下的全是人们各种合理与不合理的猜忌。
这个世界终究会归于林肯的那句名言:

你可以在部分时间骗所有人,也可以在所有时间骗部分人,但不能在所有时间欺骗所有人。
关注「古老湿」,关于科技的一切

欢迎扫描下方二维码关注「房东经济学」 更多有趣内容伴你看世界
继续阅读
阅读原文