趋近智
虽然 Matplotlib 为在 Python 中制作可视化图表提供了强大而灵活的支撑,但生成复杂的统计图表通常需要大量定制。在这种情况下,Seaborn 就派上用场了。Seaborn 是一个基于 Matplotlib 的 Python 数据可视化库,它提供了一个高级接口,用于绘制美观且信息丰富的统计图形。
可以将 Seaborn 视为 Matplotlib 的一个补充工具,而不一定是替代品。它建立在 Matplotlib 的能力之上,专门面向统计数据可视化。它的主要优点包括:
因为 Seaborn 建立在 Matplotlib 之上,您可以在需要时保留使用 Matplotlib 命令的能力,以进一步定制 Seaborn 图表。
Seaborn 的设计理念围绕着以数据集为中心的绘图函数。您无需考虑绘制单个数据数组(就像您在使用 Matplotlib 时经常做的那样),您可以直接使用数据集(通常是 Pandas DataFrame),并指定您想要可视化的变量(列)以及如何将它们映射到图表的视觉属性(例如 x 轴、y 轴、颜色、大小等)。
在创建图表之前,Seaborn 允许您设置全局美学样式。seaborn.set_theme() 函数(或旧版 seaborn.set())会为所有后续的 Matplotlib 和 Seaborn 图表应用吸引人的默认样式。
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
# 应用 Seaborn 默认主题
sns.set_theme()
# 创建一些示例数据
data = pd.DataFrame({
'x_values': np.random.randn(100),
'y_values': np.random.randn(100) * 2 + 0.5,
'category': np.random.choice(['A', 'B'], 100)
})
# 使用 Seaborn 制作一个简单的散点图
sns.scatterplot(data=data, x='x_values', y='y_values', hue='category')
plt.title('简单的 Seaborn 散点图')
plt.show()
从 Pandas DataFrame 生成的 Seaborn 散点图,自动根据“category”列分配颜色。
请注意 sns.scatterplot 如何直接接收 DataFrame (data=data) 以及 x 轴和 y 轴的列名 (x='x_values', y='y_values')。hue 参数根据指定的分类列自动为点着色。这种简洁的语法是 Seaborn 的典型特点,与单独使用 Matplotlib 相比,它大大简化了常见统计图表的制作。
在本章的后续内容中,您将学习如何运用 Seaborn 的专用函数,以快速生成富有洞察力的可视化图表,这些图表展示了数据的分布、关系和分类信息,它们是任何机器学习项目数据审视阶段的重要步骤。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造