引言:很久以前,流传着这样一句话:会写代码的干不过会做PPT的”。时光荏苒,演变至今变成了:“会做PPT的干不过会做统计图的”
现在的职场都这么直接了吗?
就是这么直接,在大数据时代,行行业业需要各种统计,要从数据中挖掘出有价值的东西,靠计算机是一条路,但是很多时候,还是需要手工把数据用可视化形式呈现出来,进而发现问题。而数据呈现的最常用方式,就是统计图。
虽说当前有各式各样的可视化工具、插件可以生成花花绿绿的统计图,但是我们在职场中应用最多的,还是OFFICE套件来做统计图。
统计图基于统计学,本身是规范严谨的,但是当前的统计图,可以说,绝大部分不符合规范,虽然有些很好看,但上不了台面。
接下来的8堂课,我们一起来畅游统计图的世界,咱一起来制作规范的、清晰的、严谨的、漂亮的、上得了台面的统计图。。。。
• 本系列教程精选自《完美统计图》一书,章节保留原书章节,但是确保内容连贯,短小精悍的8节课,推倒统计图门槛。
第一课 数据语言,没听说?
中国人过年,喜欢在家门口贴春联。贴春联,寓意吉祥,表达美好心愿:新年开张了,妖魔鬼怪快走开,福气喜气盈门来。
讲到画统计图,本章是全书的开头,我们也想图个吉利,为统计图贴上一幅春联。请看好了:上联是“文不如表”,下联是“表不如图”,横批就是“一图胜千言”。
从文不如表到表不如图,再到一图胜千言,说的就是,有时候,一段含有数据的文章,不如用统计表来表达,而用统计表来表达,不如用统计图来表达,因为一张统计图,直观生动,胜过了千言万语。
显然,呈现数据的常见方法有三种,可以用一段话,也可以用统计表,还可以用统计图。如果只能三者选其一,统计图因为形貌讨喜,应该最受欢迎。但这三者的关系亲密无间,层层递进,因为没有数据,就没有统计表,而没有统计表,就画不出统计图。
用数据画统计表,用统计表中的数据画统计图,这是画统计图的必经之路。
数据是画统计表和统计图的源头活水。要画出规范的统计表,要画出规范的统计图,必须要掌握好规范的数据语言。
什么样的数据语言是规范的呢?本章的第1节有话说。
什么样的统计表和统计图才算规范?本章的第2节和第3节有范本。
为什么俗话说“一图胜千言”?本章的第4节用实例证明。
01
数据语言的8个要素
图1-1是格桑花,寓意“幸福吉祥”。由于格桑花有8个花瓣,而数据语言恰好有8个要素,所以,格桑花又被称为“统计之花”。
图1-1  统计之花:格桑花
任何语言都讲究规范,数据语言也不例外。
生活中,如果有人大喊一声“来了!”听的人就要问:“谁来了?”如果有人说“他”,听的人就要问:“他怎么了?”
在中文里,一句话中,起码要有主语和谓语,如果缺省了其中一个,就会让人感到莫名其妙。只有“来了”,就是缺了主语,而只有“他”,就是缺了谓语。“他来了!”就是完整的一句话。当然,好奇的人还会继续追问,“他是谁呀?”“他干嘛来了?”
在数据世界,主打的是数据语言。一句规范的数据语言,必须包含8个要素,如同8瓣格桑花一样,缺一不可。如果缺省1个要素,这个数据就废了,用这样的数据画出来的统计表和统计图,同样也是废物。
下面,用一问一答的形式,来玩一个扩充数的小游戏。
目标:将“833.6”扩充为一句完整的数据语言。
以下是面对833.6这个数据的一个对话。
问:833.6是什么?是833.6元,还是833.6万元?
答:哈哈,是快递量,不是钱,是大包小包的快递,不多不少,833.6亿件。
问:原来是快递量,还真不少,哪里的?
答:中国的。
问:哪一年的呢?
答:2020年啊。
问:一年有这么多快递量,我也有贡献。对了,我不是不相信你,这个数据哪来的?
答:中国国家统计局。
问:哎呀,你可不可以把833.6的来历,一口气说清楚呀,害得我一头雾水,有好处吗?
答:当然有好处,好处就是让我们长记性。
问:长记性?
答:是啊,牢牢记住数据语言的8个要素。
下面,我们就来摆一摆谱。
把833.6这个数扩充为数据,也就是扩充为一句规范的数据语言,结果是这样的:中国国家统计局发布的统计公报显示:2020年,中国快递业务量达到833.6亿件。
问:这么短的一句话,就是数据语言,还包含了8个要素,在哪里,我怎么没看到?
答:让我们一起来看一看,数据语言的8个要素。
一个数据必备的8要素,用一句规范的数据语言来表达,是这样的:根据中国国家统计局(⑧来源)发布的统计公报《2020年中国国民经济与社会发展统计公报》显示,2020年(①时间),中国(②空间)消费者(③主体)快递业务量(④数据的名称)达到833.6(⑤数据的取值,⑥计算方法)亿件(⑦计量单位)。
一个数据必备的8要素,用一张统计表来呈现,结果如表1-1所示。
表1-1  数据语言的8个要素
问:一句数据语言,真的有8个要素呢。让我好好瞧一瞧,真的一个也不能少。只是,要记住这8个要素,有什么好的记忆方法吗?
答:记住数据语言的8个要素,就像记住一朵花那么简单。
问:是吗?
答:格桑花,吉祥的花,鲜活水灵。格桑花有8个花瓣,数据语言有8个要素。“8”与“发”同音,统计学是一门发达的学问。
问:8瓣格桑花,8个统计要素组成一句完整的数据语言,好有意思。还有什么好记的方法吗?
答:好记的方法很多。比如“4W”方法,也就是“when- where- who- what”的方法。这种方法,用“when”表示①时间,用“where”表示②空间和⑧来源,用“who”表示
③主体,用“what”表示④数据的名称、⑤数据的取值、⑥计算方法和⑦计量单位。
问:平常,一看到数据,就要想到8瓣格桑花?
答:是的,一看到数据,就要问“⑧来源”,数据是不是可信;还要知道“①时间”和“②空间”,数据的出生日和诞生地;同时还要知道“③主体”,数据所讲的主角;当然还需要知道说明主体的④数据的名称、⑤数据的取值、⑥计算方法和⑦计量单位。
问:噢,记住数据语言的8个要素,想一想,也不难。一个是记住上面这样一个简单的实例,再一个就是用“8瓣格桑花”、“发达”和“4W”来加强记忆。我想,我记住了,对吗?
答:不错,数据语言的8个要素,你肯定能记住。那些记不住的朋友,请想一想吧,因为自己的没记全,美丽的8瓣格桑花凋谢了,发达的统计学哭泣了,4个W也无从适从了。
问:如果不知道数据语言的8要素,没记全数据语言的8要素,那可就惨了!我们再来重温一下数据语言的8个要素,好吗?
答:好啊。
合:数据语言的8个要素:①时间、②空间、③主体、④数据的名称、⑤数据的取值、⑥计算方法、⑦计量单位和⑧来源。
问:对了,数学和统计学,都与数打交道,它们两个有什么区别吗?
答:问得好。它们最大的区别,就是数学上的数,可以是纯粹的数字,而统计学上的数,是数据,必须同时具备8个要素。
瞧,833.6,这是数学上的数字,它在统计学的世界是根本不存在的。只有当“833.6”具备了8个统计要素,才被准许进入统计学的世界。
换句话来讲,每一个数据都是有生命的,这个生命有自己的出生日和出生地,有自己的归宿,有自己的算法和结果,有自己的计量单位。
问:数据语言的8个要素,是进入统计学世界的通行证,是吗?
答:是的。用数据来编制统计表,用数据来画统计图,这8个基本要素千万不能丢。
问:如果一不留神丢了呢?
答:那就像丢了魂一样。这时,就要使出劲,喊一嗓子:“归来吧,魂兮归来!”
问:开玩笑的,8瓣格桑花是进入统计学大门的入场券,谁会随便丢掉呢?
合:数据语言的8个要素:①时间、②空间、③主体、④数据的名称、⑤数据的取值、⑥计算方法、⑦计量单位和⑧来源。
一句数据语言,8个要素,一个也不能少,除了要表达完整,表达还要规范。
【例1-1】 数据语言的表达要规范
问:“据统计局报道,19年,我国快递业务达到了635.2亿。” 这样的表达是否规范?
答:上面这句数据语言,有5个地方不规范。
①来源没有写全,应将“统计局”写为“中国国家统计局”。
②年份没有写全,应将“19年”写为“2019年”。
③空间没有写具体,应将“我国”写为“中国”。
④数据的名称没有写准,应将“快递业务”写为“快递业务量”。
⑤计量单位没有写全,应将“亿”写为“亿件”。
统计表是呈现数据的常见形式,画统计图离不开统计表的数据,那么,数据语言的8个要素在统计表中是怎样分布的,下一节自有分解。
02
这张统计图画得正点吗
统计图是用统计图形呈现数据的形式。
统计图的基本框架如图1-4所示。
图1-4  统计表的基本框架
由图1-4可以看到,统计图从上往下,由标题区、绘图区和来源区构成,也就是由“三区”构成。
举例来看,图1-5就是一张统计图。
图1-5  规范的柱形图
图1-5是一张规范的统计图,是用表1-2的数据画的统计图,属于统计图中的柱形图。
从形貌来看,柱形图是用柱子的长短来呈现数值的大小,最大特点就是直观形象。
用统计表画统计图,如用表1-2的数据画图1-5,两者关系亲密。在柱形图中,标题区和来源区的位置与统计表的一模一样,而在绘图区,横轴显示统计表中的分类数据“年份”,纵轴显示数值刻度,纵轴的起点值为0,柱子上显示数值,柱子上的数值不携带计量单位,计量单位站在纵轴的上方。
从统计图中提取数据语言,一般可以从下到往读取。在图1-5中,可读取“2019年,快递业务量为635.2亿件”。
图1-5的统计图“三区”和数据语言8个要素的分布如表1-5所示。
表1-5  数据的8个要素在柱形图中的实际分布
将表1-5数据的8个要素在统计图中的具体分布推广到一般情形,结果如图1-6所示。
图1-6  数据的8个要素在统计图中的分布
由表1-5和图1-6可以看到,“三区”在统计图中的分布,8个数据要素在统计图“三区”中的分布。
一张规范的统计图,由标题区、绘图区和来源区构成。在每个区中,都分布了相应的数据要素。画统计图的时候,要遵循统计图的特点,把数据的8个要素规范地分布到 “三区”中。
在统计图中,标题区和来源区的要求跟统计表一样。在绘图区中,不能缺少数据的取值和计量单位。
不同的统计图有不同的特点。比如,在直角坐标系中画的统计图,为避免统计图失真,横轴和纵轴的起点值要从0开始。又如,为美观起见,纵轴的刻度值不要太密集。
【例1-3】 问:图1-7画得正点吗?
图1-7  不规范的柱形图
答:图1-7是一张不规范的统计图,有4个地方不规范,主要集中在绘图区。
①纵轴的起点值没有从0开始,而是从200开始,统计图变形了,这是画统计图的一大误区。
②纵轴上的刻度值,看起来密密麻麻的,很不好看。
③缺了计量单位,应将计量单位“亿件”显示在纵轴的上方。
④缺了数值,应将每年快递业务量的数值放在相应的柱子上。
将不规范的图1-7修改后,规范的统计图请见图1-5。
统计图是用点、线、面的形式来呈现数据。在数据可视化时代,统计图最常见。要画出正点的统计图,不是点击一下“插入-图表”按钮就完成了。因为要画出专业的统计图,至少要做到两点,首先,数据语言的8个要素一个也不能少;其次,画统计图的基本规范一个也不能丢。做好了这两点,再加一点美学思维,这样画出来的统计图才正点,才人见人爱。
讲求规范,从数据到统计表,再从统计表到统计图,一环紧扣一环,如同“数表图的连环画”。
常言道:一图胜千言。下一节,举一个实例,一看就知道,此话不假。
第二天
一图胜千言的证明
1.4 一图胜千言的一个示例
2.1 数据可视化的示例
第三天
统计图形,怎么挑?
2.2 画统计图的准备1:选好统计表
2.3 画统计图的准备2:选好统计图形
第四天
空姐出镜,话柱线图
7.1 柱线图简介
7.2 柱线图的画法(看视频)
第五天
技巧误区,怎么看?
7.3 柱线图的技巧
7.4 画柱线图的误区
第六天
商务图表,点点评
16.2 英国《经济学人》杂志中的统计图
16.3 美国《商业周刊》杂志中的统计图
第七天
扫一扫,看美视频
18.4 故事4:从统计图看拿破仑的博罗季诺之战(看视频)
第八天
来挑战吧,你也行
19.3 畅想3:用“手机法”画统计图
03
参考书籍
完美统计图——Word/PPT/Excel数据可视化宝典》
ISBN:978-7-302-57248-1
作者:邓力、韩际平、潘璠
定价:108元
04
精彩推荐
继续阅读
阅读原文