趋近智
正确设置环境是使用 Scikit-learn 的必要步骤。Scikit-learn 旨在与现有 Python 科学计算体系顺利协作。恰当的设置能够保证你跟进示例,并将这些技术应用到你自己的项目中,避免兼容性问题。
如课程先决条件中所述,你应该已经安装了 Python,并对 NumPy 和 Pandas 有基本熟悉。Scikit-learn 直接基于这些库,特别是利用 NumPy 的数组结构和数学函数,并与 Pandas DataFrames 良好集成。
强烈建议为你的 Python 项目,包括本课程,使用虚拟环境。虚拟环境隔离项目依赖,避免了不同项目之间可能需要的同一库的不同版本造成的冲突。
使用 venv(Python 内置工具):
创建环境: 打开你的终端或命令提示符,切换到你的项目目录,然后运行:
python -m venv sklearn-env
(将 sklearn-env 替换为你偏好的环境名称)。
激活环境:
source sklearn-env/bin/activate
sklearn-env\Scripts\activate
你的终端提示符现在应该显示虚拟环境已激活。
使用 conda(如果你使用 Anaconda 或 Miniconda):
创建环境:
conda create --name sklearn-env python=3.9
(将 sklearn-env 替换为你选择的名称,如果需要,指定一个 Python 版本)。Conda 将要求你确认要安装的软件包。
激活环境:
conda activate sklearn-env
在已激活的虚拟环境中工作,可以保证你安装的软件包独立存在,并且不会影响你的全局 Python 安装或其他项目。
虚拟环境激活后,你就可以安装 Scikit-learn。该库本身依赖于 NumPy 和 SciPy。使用 pip 或 conda 等标准软件包管理器安装 Scikit-learn,通常会自动处理这些依赖关系。
使用 pip:
这是标准 Python 软件包安装器。如果你不使用 Anaconda 分发版,这通常是最简单的方法。
pip install scikit-learn
此命令将下载并安装最新稳定版本的 Scikit-learn,如果你的环境中尚未存在 NumPy 和 SciPy,它还会一并安装所需的版本。
使用 conda:
如果你正在使用 Anaconda 或 Miniconda,conda 是推荐的软件包管理器。
conda install scikit-learn
Conda 管理软件包和环境,包括可能复杂的二进制依赖,这有时会带来好处,尤其是在 Windows 上。
Scikit-learn 的主要依赖是:
<https://numpy.org/>)。Scikit-learn 的主要数据结构通常是 NumPy 数组。<https://scipy.org/>)。这些库构成了科学 Python 生态系统的基础,并且几乎总是与 Scikit-learn 一同安装。
尽管对于基本的 Scikit-learn 使用并非严格必需,但在典型的机器学习工作流程中,你经常会用到其他库:
<https://pandas.pydata.org/>)。Scikit-learn 与 Pandas DataFrames 集成度很高。<https://matplotlib.org/>)。有助于数据分析和模型评估。<https://seaborn.pydata.org/>)。如果你的环境中尚未安装这些库,你可以使用 pip 或 conda 添加它们:
使用 pip:
pip install pandas matplotlib seaborn jupyterlab
(我们在这里加入了 jupyterlab,因为它提供了一个方便的交互式数据科学工作环境,你可能会觉得它有用)。
使用 conda:
conda install pandas matplotlib seaborn jupyterlab
为确认 Scikit-learn 已正确安装,你可以在已激活的虚拟环境中启动 Python 解释器或 Jupyter Notebook 会话,然后运行以下命令:
import sklearn
import numpy
import scipy
import pandas # 可选,如果已安装
import matplotlib # 可选,如果已安装
# 打印 scikit-learn 版本
print(f"Scikit-learn version: {sklearn.__version__}")
print(f"NumPy version: {numpy.__version__}")
print(f"SciPy version: {scipy.__version__}")
# print(f"Pandas version: {pandas.__version__}") # 如果已安装,请取消注释
# print(f"Matplotlib version: {matplotlib.__version__}") # 如果已安装,请取消注释
如果这些命令执行时没有引发 ImportError 并打印库版本,那么你的环境就设置正确了,可以继续学习 Scikit-learn 的功能了。我们将在本章末的动手实践中进行更正式的验证。
这部分内容有帮助吗?
venv - Creation of virtual environments, Python Software Foundation, 2024 (Python Software Foundation) - 提供有关使用Python内置venv模块创建和管理隔离项目环境的全面信息。© 2026 ApX Machine Learning用心打造