你已了解常见图表类型:条形图、折线图、饼图和散点图。但你如何决定哪种才是适合这项工作的工具呢?选择错误的图表可能会使你的信息不明确,甚至误导你的受众。然而,合适的图表能使你的数据易于理解,并突出主要规律。
选择过程通常取决于你想在数据中展示或比较什么。下面我们来分析常见目的以及最能满足这些目的的图表。
比较类别间的数值
当你需要比较不同的项目或组时,条形图通常是你的最佳选择。条形图使用条形的长度或高度来表示大小,使得容易看出哪些类别更大或更小。
- 用途: 比较不同产品类别的销售额,显示来自不同国家的网站流量,或可视化不同选项的调查回复。
- 变体:
- 垂直条形图(柱状图): 在比较适中数量的类别(例如5-10个)时最适用。类别标签能很好地容纳在水平轴上。
- 水平条形图: 当你有许多类别或类别名称很长,无法整齐地容纳在垂直图表的水平轴上时,这种图表最理想。
四种不同产品类别的月销售额。条形图清楚显示电子产品的销售额最高。
显示随时间变化的趋势
如果你的数据涉及追踪连续时间段(通常是天、月或年)内的变化或趋势,折线图通常是最有效的。折线图将数据点用线连接,使得容易看出该时间段内的增长、下降和波动。
- 用途: 追踪一年内的股价,监测每月网站访客,显示一天中的温度变化。
- 注意事项: 确保水平轴表示连续变量,如时间或距离。对离散类别(如上述产品类别)使用折线图可能会暗示类别之间不存在的关联。
每月追踪的网站访客数量。折线图清楚地展现了六个月期间的上升趋势。
显示整体的构成部分(构成)
当你需要显示总量如何分成部分或百分比时,饼图是一个常见选择。每块扇形表示整体的一个比例。
- 用途: 显示竞争对手之间的市场份额分布,可视化按部门划分的预算分配,表示产品中不同成分的构成。
- 注意: 当扇形过多(通常超过5或6个)或比例非常接近时,饼图会变得难以准确阅读和比较。在这种情况下,条形图可能更清晰。确保百分比总和为100%。
浏览器市场份额的分布。饼图强调了Chrome相比其他浏览器的主导份额。
检验两个变量之间的关系
为了了解两个不同的数值变量之间是否存在潜在关系或相关性,散点图是标准的可视化图表。图上的每个点表示一个观测值,其坐标对应于这两个变量的数值。
- 用途: 检验学习时长与考试分数之间的关系,比较广告支出与销售收入,寻找身高与体重之间的规律。
- 解释: 点的分布规律可以表明不同类型的关系:
- 正相关: 点的趋势从左到右向上(当一个变量增加时,另一个变量也倾向于增加)。
- 负相关: 点的趋势从左到右向下(当一个变量增加时,另一个变量倾向于减少)。
- 无明确相关: 点随机分布,没有可辨别的规律。
学习时长与期末考试分数之间的关系。散点图表明积极趋势:学习时长越多通常对应更高的分数。
简单的决策指南
虽不尽全面,但这里有一个基本思考过程:
- 主要信息是什么? 你是在比较项目、显示随时间的变化、说明整体的构成部分,还是在寻找关系?
- 涉及多少个变量?
- 一个变量跨类别?-> 条形图(比较)或饼图(构成,如果类别较少)。
- 一个变量随时间变化?-> 折线图。
- 两个数值变量?-> 散点图(关系)。
- 有多少个类别或数据点?
- 许多类别?-> 水平条形图可能比垂直条形图更好。
- 饼图扇形过多?-> 考虑使用条形图。
选择合适的图表是数据可视化中的一项基本技能。它确保你的数据故事清晰准确地呈现。随着你处理更多数据,你会形成直觉,但从这些指导开始提供了一个坚实的基础。请记住始终清晰标注你的轴,并为你的图表提供描述性标题。