在开始使用 NumPy 和 Pandas 之前,你需要在电脑上安装它们。这些库默认不内置于 Python,因此你需要添加它们。这个过程需要使用名为包管理器的工具,它们能帮助下载和安装我们需要的这类软件库。有两种主要方式可以在 Python 中配置你的数据科学工作环境:使用 Anaconda 分发版或使用 Python 的标准包安装器 pip。我们建议初学者使用 Anaconda,因为它能大大简化这个过程。方案一:安装 Anaconda(推荐)Anaconda 是一个免费、开源的 Python 和 R 分发版,专门为科学计算和数据科学而设计。它捆绑了 Python、许多必需的库(包括 NumPy、Pandas 和 Jupyter Notebooks),以及它自己的包管理器 conda。为什么选择 Anaconda?便捷性: 它能一次性安装 Python 和数百个流行的数据科学包。NumPy 和 Pandas 通常已包含在内,因此你甚至可能无需单独安装它们。环境管理: conda 使得为不同项目创建隔离环境变得容易,从而避免库版本之间的冲突。跨平台: 它可在 Windows、macOS 和 Linux 上运行。步骤:下载: 访问 Anaconda 官方分发网站 (https://www.anaconda.com/products/distribution),下载适用于你操作系统的安装程序(Windows、macOS 或 Linux)。选择 Python 3.x 版本(通常建议选择最新的稳定版)。安装: 运行下载的安装程序。按照屏幕上的说明进行操作。除非有特殊原因,我们建议接受默认设置。安装过程中有一个重要选择(尤其是在 Windows 上),即是否将 Anaconda 添加到系统 PATH。安装程序通常不建议这样做,而是建议你使用“Anaconda Prompt”(在 Windows 上)或常规终端(在 macOS/Linux 上),这是一个好的建议。验证(可选): 安装完成后,你可以打开 Anaconda Prompt (Windows) 或你的终端 (macOS/Linux),并检查 conda 是否可用:conda --version你应该会看到 conda 的版本号被打印出来。检查/安装 NumPy 和 Pandas: Anaconda 通常包含 NumPy 和 Pandas。你可以通过输入以下命令来检查:conda list numpy pandas如果它们已列出,你就可以开始了!如果未列出,或者你想确保拥有与该分发版兼容的最新版本,你可以安装或更新它们:# 如果缺少则安装: conda install numpy pandas jupyterlab # 更新现有包: conda update numpy pandas jupyterlab我们在这里包含 jupyterlab 是因为它提供了我们即将使用的 Jupyter Notebook 环境。方案二:使用 pip 和虚拟环境如果你的系统上已经安装了 Python(从 python.org 下载或通过其他方式安装),并且你不想使用 Anaconda,那么你可以使用 pip,它是 Python 默认的包安装器。为什么选择 pip?标准: 它是标准的 Python 包管理器。精简: 如果你不需要 Anaconda 提供的所有额外功能,它能提供一个更轻量级的设置。最佳实践:虚拟环境使用 pip 时,强烈建议使用虚拟环境。虚拟环境是一个隔离的目录,其中包含特定的 Python 版本及其自己安装的库集。这可以防止不同项目所需的包之间发生冲突。Python 通过 venv 模块内置支持此功能。步骤:确保 Python 和 pip 已安装: 首先,请确保你已安装 Python 3。打开你的终端或命令提示符并输入:python --version # 或者可能是 python3 --version pip --version # 或者可能是 pip3 --version如果这些命令有效并显示版本,则说明你已准备就绪。如果无效,你需要先从 python.org 安装 Python。pip 通常包含在 Python 3.4 及更高版本中。创建虚拟环境: 在终端中导航到你的项目目录(或创建一个),然后运行:# 将 'myenv' 替换为你偏好的环境名称 python -m venv myenv这将创建一个名为 myenv 的目录,其中包含 Python 安装文件。激活环境: 在安装包之前,你需要激活环境:在 macOS 和 Linux 上:source myenv/bin/activate在 Windows (命令提示符) 上:myenv\Scripts\activate.bat在 Windows (PowerShell) 上:myenv\Scripts\Activate.ps1(你可能需要调整执行策略:Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope Process)你的终端提示符应该会改变,以表明环境(本例中为 myenv)已激活。安装库: 现在,使用 pip 安装 NumPy、Pandas 和 JupyterLab:pip install numpy pandas jupyterlabpip 会将库下载并安装到你当前激活的虚拟环境中。停用(完成后): 当你完成项目工作时,只需输入以下命令即可停用环境:deactivate验证你的安装无论你选择了哪种方法,验证库是否正确安装并且可以在 Python 中导入都是一个好习惯。启动 Python 解释器: 打开你的终端(或 Anaconda Prompt)。如果你使用了虚拟环境,请确保它已激活。输入 python 并按回车键。你应该会看到 Python 提示符 (>>>)。导入库: 逐一输入以下命令:import numpy as np import pandas as pd print(f"NumPy version: {np.__version__}") print(f"Pandas version: {pd.__version__}")检查输出: 如果命令执行没有错误,并打印出 NumPy 和 Pandas 的版本号,那么你的安装就成功了!退出解释器: 输入 exit() 并按回车键,退出 Python 解释器。你的环境现在已配置完成,你已拥有基本的工具。在下一节中,我们将在 Jupyter Notebook(许多数据科学家偏爱的交互式环境)中运行一些基本代码示例,开始使用这些库。