理解了我们为何将数据可视化之后,下一步是学习如何操作。几种标准图表类型是进行数据可视化呈现和交流的构成部分。每种类型都适合不同种类的数据和信息。让我们看看一些最常使用的。柱状图柱状图非常适合比较不同类别间的数值。它们使用矩形条,可以是垂直或水平的,其中条的长度与其代表的数值成比例。用途: 比较不同组或类别的数量。例子包括月销售额、按来源划分的网站流量或功能使用次数。变体: 可以是垂直的(柱形图)或水平的(条形图)。分组柱状图用于比较每个主要类别中的子类别,而堆叠柱状图显示总数如何在不同类别中分成若干部分。这是一个简单的例子,比较一周内销售的水果数量:{"layout":{"title":{"text":"周水果销售量"},"xaxis":{"title":{"text":"水果类型"}},"yaxis":{"title":{"text":"销售数量"}},"margin":{"l":40,"r":30,"b":40,"t":60}},"data":[{"type":"bar","x":["苹果","橙子","香蕉","葡萄"],"y":[50,35,70,45],"marker":{"color":["#f03e3e","#fd7e14","#fab005","#82c91e"]}}]}一周内销售的不同水果数量。柱状图使得一眼就能看出哪个类别具有最高或最低值,并能比较类别间的量级。折线图折线图最适合显示随时间或其他连续序列的变化趋势。数据点被绘制并由线连接,使得显示增长、下降或波动变得容易。用途: 追踪连续间隔内的变化,例如时间(天、月、年)。例子包括股票价格变动、一天中的温度变化,或几个月内的网站访问者趋势。变体: 可以在同一图表上绘制多条线,以比较不同组别的趋势。面积图类似,但会填充线下的区域,这可以强调总量或累计总数。来看这个一周内网站访问者的可视化呈现:{"layout":{"title":{"text":"每日网站访问者"},"xaxis":{"title":{"text":"星期几"}},"yaxis":{"title":{"text":"访问者数量"}},"margin":{"l":40,"r":30,"b":40,"t":60}},"data":[{"type":"scatter","mode":"lines+markers","x":["周一","周二","周三","周四","周五","周六","周日"],"y":[120,150,135,160,180,210,190],"line":{"color":"#228be6"}}]}一周内每天记录的网站访问者数量。折线图清楚地显示了变化的趋势和速率。饼图饼图表示比例或百分比,显示整体如何分成若干部分。整个圆形(“饼图”)代表100%,每个“切片”的大小对应其占整体的比例。用途: 显示整体的构成,其中每个类别代表一个百分比。例子包括市场份额分布、按部门划分的预算分配,或按选项细分的调查回复。注意: 如果切片过多或切片代表的比例非常接近,饼图会变得难以阅读和准确比较。它们通常最适合显示整体中少数几个明确的部分。柱状图通常是进行类别间精确比较的更好替代方法。此饼图显示了一个简单调查问题的回复分布:{"layout":{"title":{"text":"最喜爱的季节调查结果"},"margin":{"l":40,"r":30,"b":40,"t":60}},"data":[{"type":"pie","labels":["春季","夏季","秋季","冬季"],"values":[25,35,20,20],"marker":{"colors":["#69db7c","#ffd43b","#ff922b","#a5d8ff"]}}]}根据调查回复得出的最喜爱的季节的百分比分布。谨慎使用饼图,尤其是在强调简单的部分与整体关系时。散点图散点图用于显示两个数值变量之间的关系。图上的每个点代表一个观测值(例如单个客户或数据条目),并根据其在两个轴上的值进行定位。用途: 识别两个连续变量之间的相关性或模式。例子包括绘制身高与体重、广告支出与销售收入,或学习时间与考试分数。解读: 绘制点的模式可以表明正向关系(点向上趋势)、负向关系(点向下趋势),或没有明确关系。它们还可以帮助识别异常值,异常值是远离一般模式的点。让我们显示学习时间与考试分数之间的关系:{"layout":{"title":{"text":"学习时间与考试分数"},"xaxis":{"title":{"text":"学习小时数"}},"yaxis":{"title":{"text":"考试分数 (%)"}},"margin":{"l":40,"r":30,"b":40,"t":60}},"data":[{"type":"scatter","mode":"markers","x":[1, 2, 3, 4, 5, 6, 7, 8],"y":[55, 60, 68, 70, 75, 82, 88, 92],"marker":{"color":"#7950f2","size":10}}]}学生学习小时数与相应考试分数之间的关系。散点图是数据初步分析中的基本工具,用于在应用更复杂的建模技术之前,了解变量之间可能存在的联系。这四种图表类型构成了数据可视化的基本工具集。理解它们的优势和合适的用途是数据科学中的一项基本能力。随着学习的进展,您会接触到许多其他专门的图表类型,但这些为可视化呈现数据提供了坚实的基础。