动手实践：安装验证

确保您的 Scikit-learn 环境设置正确是构建机器学习 (machine learning)模型之前的一个主要步骤。本实践练习将引导您验证 Scikit-learn 安装并加载其一个示例数据集。成功运行此代码可确认您的环境已准备就绪。

首先，让我们确认 Python 可以找到您的 Scikit-learn 安装并检查其版本。打开您的 Python 解释器、Jupyter Notebook 或 IDE 并运行以下代码：

import sklearn

# 打印安装的版本
print(f"Scikit-learn version: {sklearn.__version__}")

您应该会看到打印出的安装版本号，且没有任何 ImportError 消息。具体版本可能不同，但看到版本号（例如 1.2.2 或更高）则表示成功。如果您遇到错误，请重新查看“安装与环境设置”部分，以确保 Scikit-learn 及其依赖项（如 NumPy 和 SciPy）已在您的活动 Python 环境中正确安装。

接下来，让我们尝试加载前面讨论过的一个内置数据集。sklearn.datasets 中的 load_iris 函数提供了经典的 Iris 数据集，该数据集常用于入门级分类示例。

from sklearn.datasets import load_iris
import numpy as np

# 加载 Iris 数据集
iris = load_iris()

# 加载的对象是 'Bunch' 对象，类似于字典
print(f"iris 数据集的键：{iris.keys()}")

# 数据通常存储在 .data 中，目标标签存储在 .target 中
# 这些通常是 NumPy 数组
print(f"数据形状：{iris.data.shape}")
print(f"目标形状：{iris.target.shape}")

# 让我们查看前 5 个样本及其对应的目标
print("\n前 5 个样本（特征）：\n", iris.data[:5])
print("\n前 5 个目标（标签）：\n", iris.target[:5])

# 特征名称和目标名称也经常包含在内
print(f"\n特征名称：{iris.feature_names}")
print(f"\n目标名称：{iris.target_names}")

执行此代码应输出：

iris 对象中可用的键（如 data、target、target_names、feature_names、DESCR）。
data 数组的形状（通常为 (150, 4)，表示 150 个样本和 4 个特征）。
target 数组的形状（通常为 (150,)，表示每个样本的类别标签）。
前五个样本的实际数值数据。
前五个样本的目标标签（0、1 或 2）。
四个特征的名称（例如，“sepal length (cm)”、“sepal width (cm)”等）。
三个目标类别的名称（例如，“setosa”、“versicolor”、“virginica”）。

如果两个代码片段都无错误运行并产生与所述类似的输出，则您的 Scikit-learn 环境已正确配置。您已成功导入该库并以它预期的数据格式加载了数据。您现在可以继续学习后续章节了，在这些章节中，您将开始使用 Scikit-learn 构建和评估机器学习模型。