你好,我是zhenguo
上一篇文章如何选用最合适的图形表达数据?我的一个思路,我们探讨了数值型变量如何选图的一些技巧,今天讨论分类型变量选图策略。
那么,什么是分类型变量,很好理解,像这样的:
第一个,最先想到的应该是柱状图
第二个,一个很有意思的、特殊的柱状图:棒棒糖图,柱状图被转换成一条线和一个点。它显示了数字变量和分类变量之间的关系,下图是基本的棒棒图:
第三个,热力图也能表达分类变量和数字的关系,上篇文章我们提到热力图,在此不详细展开:
第四个,词云图(Wordcloud)也能可视化分类变量,显示一个单词列表中每个单词的重要性,用字体大小或颜色显示:
第五个,饼图是一个分为多个部分的圆,每个部分代表一个整体的比例,也能用来表达分类变量:
第六个,树状图将层次数据显示为一组嵌套的矩形。每组由一个矩形表示,矩形的面积与其值成比例。树形图的优点是能够有效地表示大量的数据。如果有多个层次结构(>2),建议构建一个交互式图形:单击上层将显示下一层。
import
 matplotlib.pyplot 
as
 plt

import
 squarify 


squarify.plot(sizes=[
13
,
22
,
35
,
5
], label=[
"group A"
"group B"
"group C"
"group D"
], color=[
"red"
,
"green"
,
"blue"
"grey"
], alpha=
.4
 )

plt.axis(
'off'
)

plt.show()

后面你再遇到分类变量可视化时,可以找出这篇文章,应该对你有一定参考价值。所以,建议收藏,点赞支持。

近期我创建了一个从零学Python数据分析的知识星球,专门分享Python和数据分析的宝书、最精华的学习路线、问答和打卡,现在加入,还可以免费加入另一个我的算法刷题日记星球。可以说,超级划算。
长按图中二维码加入
以后别每天为找不到方向而彷徨了,也别淹没在浩瀚的资料中而迷失自己了,这两个星球是专门解决这两个问题的。我在背后的付出是巨大的,希望我的用心,能够真正帮助到你,干净地解决你的痛点
继续阅读
阅读原文