做数据分析的人,有些国民经济的数据必须要牢记心中,比如中国有14亿人口,超过1亿常住人口的省份有两个,分别是广东省和山东省,超过两千万人口的城市是上海、重庆、北京......

这些常识数据也许并不能直接用在企业日常的数据分析中去,但是可以开拓分析师们的视野,在企业做年度预算、策略规划、新入市场等方面就能发挥作用了。
有些人把数据保存在电脑中,但高阶的数据分析师基本上会把一些企业重要数据保存在自己的大脑中,这样的好处是可以随时调用。比如企业的销售额、客户总数、员工数、离职率、历史最高月销售、历史最低月销售等等,这样的好处是既可以避免被老板突然袭击回答不出的尴尬,又可以在看别人报告时随时随地的纠错。而纠错本来就是分析师应该具备的基本素质。
想想,如果老板问你一个数据,你答不上来或者现翻电脑多尴尬。所以作为一个分析师必须要记住一些关键业务数据,刚开始可能需要死记硬背,但时间长了就可以做到“过目不忘”。最关键是随时随地的累记,比如参加公司月会,人事总监汇报上月的离职率,销售总监汇报的月销售额......这些数据都会闯入你的大脑,别放掉,记下来。

记忆、纠错这个过程其实就是在训练自己数据敏感度的过程,很多人说自己对数据不敏感,那是借口归根到底是没用心,或者认为很多数据事不关己。比如你让一个负责商品数据分析的人记离职率这个数据他可能会觉得很扯,但离职会影响销售,销售就会影响商品,其实数据之间是关联的,记一些关键的无关数据,多多益善。
对于一些宏观数据,其实我们也需要掌握,比如我们国家现在城镇化率是多少?每个家庭的平均人口数是多少?很多人可能说企业关键数据要记下来有道理,宏观数据要记下来没什么用。不不不,大有用处,简单来说它可以训练你们的思维能力,还能提高你的商业思考,数据分析能力。

这几年,很多企业招聘产品经理特别喜欢出一些看似无解的题目,比如:请问中国有多少辆私家小汽车?
如果你的第一反应是百度,那这个职位显然不适合你。这个问题对方要的不是绝对答案,而是你的思考过程。给你们三分钟做做下面几道常识题后我再公布答案。

接下来我开始解题了,要解这题社会经验和数据认知很重要。想要知道有多少私家车最好能知道中国有多少家庭数,然后根据经验判断大概多少比例的家庭有私家车,要知道家庭数最好是知道人口总数,而人口总数基本上就是一个常识性问题,大家都应该知道的。

所以这道题的逻辑就转化为私家车数量--家庭数--人口数的问题。当然还需要一些更好的逻辑和细节处理后答案才可能接近真实答案。比如家庭最好分为农村和城市来思考,因为这两个范畴的私家车拥有率是大不同的。

思考起点:中国有14亿人

如果你恰巧知道中国的城镇化率是60.6%(2019年的数据),简单就可以算出来城镇人口8.5亿,农村人口5.5亿。如果这个知识点没有也无所谓,你可以简单粗暴的分为各7亿人口也是可以的,只是简单粗暴一些。

要想知道城镇和农村的家庭总数,必须要知道平均家庭人口数即家庭人口规模。如果你恰巧知道中国平均家庭人口是3.1人(这里的家庭指长住在一起,而不是大家熟悉的户口本的概念),同时也知道一般城镇数据会小于农村,则可以大胆猜测城镇为2.8人,农村为3.5人。如果你不知道3.1这个数据也无妨,凭生活常识大概也应该知道城镇每个家庭大多在2人或3人家庭为主,4人家庭为辅。农村基本上是3-4人的家庭为主,5人家庭也已经很少了。同样也可以估计一个数据出来。

根据前面的数据可以算出来城镇家庭约3.0亿个,农村家庭1.7亿个。现在的问题就是百户家庭的私家车拥有率是多少?这个问题可以忽略有些家庭有超过1辆私家车的情况,毕竟是少数。

私家车拥有率也是一个生活常识的判断问题,看看自己的朋友圈、公司同事、小区等等。但这种生活常识你不能只是拘泥于自己的身边,还要综合看中西部,南北差异等来猜测一个值。比如我们可以猜测城镇是50%,农村是30%。当然你猜其它数字也是可以的,毕竟只是一个思维训练而已。

综合上面的数据得出中国私家车总数约2.01亿辆,这个数据肯定不是一个正确数据但从逻辑的角度保证它离正确数据应该不会差太远。官方数据是截止2019年底私家车保有量2.07亿辆。
所以只要逻辑正确很多看似无解的问题都可以轻松应对。有些人可能觉得这种方法很神奇,其实这是数据分析师们的基本操作。
这种看似无解的问题统统称为费米问题,它是美国科学家恩利克·费米提出来的一个概念,费米问题的特点是刚开始看到这种问题时,会觉得已知条件太少,根本不可能“算”出答案来。但当你改变分析对象找到分析逻辑之后,所有这类问题就会迎刃而解,不需要求助专家也不需要搜索就可以出乎意料地“解出”接近的答案来。
而这一切,外人看来会非常的神奇且不可思议。所以费米问题有时候还能小小的满足分析师们的虚荣心。

费米问题的提出和1945年世界上第一颗原子弹爆炸有关,当时美国在新墨西哥州的沙漠中试爆世界上第一颗原子弹,而费米感受到了它的震动。随即费米从自己的笔记本中撕下一页纸,然后撕成碎片举过头顶让它们自由的飘落下来,最后这些碎纸片落在他身后2.5米的距离。据此,费米估算出这颗原子弹相当于10000tTNT当量,而后科学家的计算结果也证实了费米的“猜测”在数量级上是正确的。
所以,一些关键的常识数据,加上分析逻辑,其实可以猜出不少看似无解的难题。最后给大家推荐一下可以查询宏观数据的网站,很好用的。

1、国家数据库:
http://data.stats.gov.cn/index.htm 可以查询我国的各种数据,如GDP、CPI、总人口、社会消费品零售总额、粮食产量、PMI、PPI……数据可以免费下载成Excel文件,另外也推出了移动客户端:数据中国pro

2、美联储经济数据库:
https://fred.stlouisfed.org/ 查询到的数据以美国为主,也有少数其他的西方国家,可以查询到50年代的数据,支持免费下载

3、世界银行:
https://data.worldbank.org.cn/ 查询全球各国相关各方面的宏观数据,免费提供CSV文件下载(Excel可以直接打开),非常方便

4、IndexMundi:
https://www.indexmundi.com/ 包含详细的全球各国的统计数据,可以按地区,国家,主题,行业部门和类型组织的几千种指标。它并不是一个官方组织,而是一个第三方网站,但是整合了各种数据来源,查询起来还是非常方便的,建议可以和世界银行的数据一起结合使用。
最后附上面几道题的答案分别是:第三产业、3.0左右、60%左右、45%左右、7%左右。这些数据都可以在国家数据库的网站上查到。
——————

继续阅读
阅读原文