趋近智
在开始使用 NumPy 和 Pandas 之前,你需要在电脑上安装它们。这些库默认不内置于 Python,因此你需要添加它们。这个过程需要使用名为包管理器的工具,它们能帮助下载和安装我们需要的这类软件库。
有两种主要方式可以在 Python 中配置你的数据科学工作环境:使用 Anaconda 分发版或使用 Python 的标准包安装器 pip。我们建议初学者使用 Anaconda,因为它能大大简化这个过程。
Anaconda 是一个免费、开源的 Python 和 R 分发版,专门为科学计算和数据科学而设计。它捆绑了 Python、许多必需的库(包括 NumPy、Pandas 和 Jupyter Notebooks),以及它自己的包管理器 conda。
为什么选择 Anaconda?
conda 使得为不同项目创建隔离环境变得容易,从而避免库版本之间的冲突。步骤:
conda 是否可用:
conda --version
你应该会看到 conda 的版本号被打印出来。conda list numpy pandas
如果它们已列出,你就可以开始了!如果未列出,或者你想确保拥有与该分发版兼容的最新版本,你可以安装或更新它们:
# 如果缺少则安装:
conda install numpy pandas jupyterlab
# 更新现有包:
conda update numpy pandas jupyterlab
我们在这里包含 jupyterlab 是因为它提供了我们即将使用的 Jupyter Notebook 环境。如果你的系统上已经安装了 Python(从 python.org 下载或通过其他方式安装),并且你不想使用 Anaconda,那么你可以使用 pip,它是 Python 默认的包安装器。
为什么选择 pip?
最佳实践:虚拟环境
使用 pip 时,强烈建议使用虚拟环境。虚拟环境是一个隔离的目录,其中包含特定的 Python 版本及其自己安装的库集。这可以防止不同项目所需的包之间发生冲突。Python 通过 venv 模块内置支持此功能。
步骤:
确保 Python 和 pip 已安装: 首先,请确保你已安装 Python 3。打开你的终端或命令提示符并输入:
python --version
# 或者可能是 python3 --version
pip --version
# 或者可能是 pip3 --version
如果这些命令有效并显示版本,则说明你已准备就绪。如果无效,你需要先从 python.org 安装 Python。pip 通常包含在 Python 3.4 及更高版本中。
创建虚拟环境: 在终端中导航到你的项目目录(或创建一个),然后运行:
# 将 'myenv' 替换为你偏好的环境名称
python -m venv myenv
这将创建一个名为 myenv 的目录,其中包含 Python 安装文件。
激活环境: 在安装包之前,你需要激活环境:
source myenv/bin/activate
myenv\Scripts\activate.bat
myenv\Scripts\Activate.ps1
(你可能需要调整执行策略:Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope Process)你的终端提示符应该会改变,以表明环境(本例中为 myenv)已激活。
安装库: 现在,使用 pip 安装 NumPy、Pandas 和 JupyterLab:
pip install numpy pandas jupyterlab
pip 会将库下载并安装到你当前激活的虚拟环境中。
停用(完成后): 当你完成项目工作时,只需输入以下命令即可停用环境:
deactivate
无论你选择了哪种方法,验证库是否正确安装并且可以在 Python 中导入都是一个好习惯。
python 并按回车键。你应该会看到 Python 提示符 (>>>)。import numpy as np
import pandas as pd
print(f"NumPy version: {np.__version__}")
print(f"Pandas version: {pd.__version__}")
exit() 并按回车键,退出 Python 解释器。你的环境现在已配置完成,你已拥有基本的工具。在下一节中,我们将在 Jupyter Notebook(许多数据科学家偏爱的交互式环境)中运行一些基本代码示例,开始使用这些库。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造