【数据分析】可视化分类型变量,我一般使用这6种图形

上一篇文章如何选用最合适的图形表达数据?我的一个思路,我们探讨了数值型变量如何选图的一些技巧,今天讨论分类型变量选图策略。

那么,什么是分类型变量,很好理解,像这样的:

《【数据分析】可视化分类型变量,我一般使用这6种图形》

第一个,最先想到的应该是柱状图

《【数据分析】可视化分类型变量,我一般使用这6种图形》

第二个,一个很有意思的、特殊的柱状图:棒棒糖图,柱状图被转换成一条线和一个点。它显示了数字变量和分类变量之间的关系,下图是基本的棒棒图:

《【数据分析】可视化分类型变量,我一般使用这6种图形》

第三个,热力图也能表达分类变量和数字的关系,上篇文章我们提到热力图,在此不详细展开:

《【数据分析】可视化分类型变量,我一般使用这6种图形》

第四个,词云图(Wordcloud)也能可视化分类变量,显示一个单词列表中每个单词的重要性,用字体大小或颜色显示:《【数据分析】可视化分类型变量,我一般使用这6种图形》

第五个,饼图是一个分为多个部分的圆,每个部分代表一个整体的比例,也能用来表达分类变量:

《【数据分析】可视化分类型变量,我一般使用这6种图形》

第六个,树状图将层次数据显示为一组嵌套的矩形。每组由一个矩形表示,矩形的面积与其值成比例。树形图的优点是能够有效地表示大量的数据。如果有多个层次结构(>2),建议构建一个交互式图形:单击上层将显示下一层。

import matplotlib.pyplot as plt
import squarify 
 
squarify.plot(sizes=[13,22,35,5], label=["group A", "group B", "group C", "group D"], color=["red","green","blue", "grey"], alpha=.4 )
plt.axis('off')
plt.show()

《【数据分析】可视化分类型变量,我一般使用这6种图形》

后面你再遇到分类变量可视化时,可以找出这篇文章,应该对你有一定参考价值。所以,建议收藏,点赞支持。


往期精彩回顾



适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑温州大学《机器学习课程》视频
本站qq群851320808,加入微信群请扫码:

    原文作者:风度78
    原文地址: https://blog.csdn.net/fengdu78/article/details/118741268
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞