环境配置

在开始使用 NumPy 和 Pandas 之前，你需要在电脑上安装它们。这些库默认不内置于 Python，因此你需要添加它们。这个过程需要使用名为包管理器的工具，它们能帮助下载和安装我们需要的这类软件库。

有两种主要方式可以在 Python 中配置你的数据科学工作环境：使用 Anaconda 分发版或使用 Python 的标准包安装器 pip。我们建议初学者使用 Anaconda，因为它能大大简化这个过程。

Anaconda 是一个免费、开源的 Python 和 R 分发版，专门为科学计算和数据科学而设计。它捆绑了 Python、许多必需的库（包括 NumPy、Pandas 和 Jupyter Notebooks），以及它自己的包管理器 conda。

为什么选择 Anaconda？

步骤：

下载： 访问 Anaconda 官方分发网站 (https://www.anaconda.com/products/distribution)，下载适用于你操作系统的安装程序（Windows、macOS 或 Linux）。选择 Python 3.x 版本（通常建议选择最新的稳定版）。
安装： 运行下载的安装程序。按照屏幕上的说明进行操作。除非有特殊原因，我们建议接受默认设置。安装过程中有一个重要选择（尤其是在 Windows 上），即是否将 Anaconda 添加到系统 PATH。安装程序通常不建议这样做，而是建议你使用“Anaconda Prompt”（在 Windows 上）或常规终端（在 macOS/Linux 上），这是一个好的建议。
验证（可选）： 安装完成后，你可以打开 Anaconda Prompt (Windows) 或你的终端 (macOS/Linux)，并检查 conda 是否可用：
```
conda --version
```
你应该会看到 conda 的版本号被打印出来。
检查/安装 NumPy 和 Pandas： Anaconda 通常包含 NumPy 和 Pandas。你可以通过输入以下命令来检查：
```
conda list numpy pandas
```
如果它们已列出，你就可以开始了！如果未列出，或者你想确保拥有与该分发版兼容的最新版本，你可以安装或更新它们：
```
# 如果缺少则安装：
conda install numpy pandas jupyterlab

# 更新现有包：
conda update numpy pandas jupyterlab
```
我们在这里包含 jupyterlab 是因为它提供了我们即将使用的 Jupyter Notebook 环境。

如果你的系统上已经安装了 Python（从 python.org 下载或通过其他方式安装），并且你不想使用 Anaconda，那么你可以使用 pip，它是 Python 默认的包安装器。

为什么选择 pip？

最佳实践：虚拟环境

使用 pip 时，强烈建议使用虚拟环境。虚拟环境是一个隔离的目录，其中包含特定的 Python 版本及其自己安装的库集。这可以防止不同项目所需的包之间发生冲突。Python 通过 venv 模块内置支持此功能。

步骤：

确保 Python 和 pip 已安装： 首先，请确保你已安装 Python 3。打开你的终端或命令提示符并输入：
```
python --version
# 或者可能是 python3 --version
pip --version
# 或者可能是 pip3 --version
```
如果这些命令有效并显示版本，则说明你已准备就绪。如果无效，你需要先从 python.org 安装 Python。pip 通常包含在 Python 3.4 及更高版本中。
创建虚拟环境： 在终端中导航到你的项目目录（或创建一个），然后运行：
```
# 将 'myenv' 替换为你偏好的环境名称
python -m venv myenv
```
这将创建一个名为 myenv 的目录，其中包含 Python 安装文件。
激活环境： 在安装包之前，你需要激活环境：
- 在 macOS 和 Linux 上：
```
source myenv/bin/activate
```
- 在 Windows (命令提示符) 上：
```
myenv\Scripts\activate.bat
```
- 在 Windows (PowerShell) 上：
```
myenv\Scripts\Activate.ps1
```
  （你可能需要调整执行策略：Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope Process）
你的终端提示符应该会改变，以表明环境（本例中为 myenv）已激活。
安装库： 现在，使用 pip 安装 NumPy、Pandas 和 JupyterLab：
```
pip install numpy pandas jupyterlab
```
pip 会将库下载并安装到你当前激活的虚拟环境中。
停用（完成后）： 当你完成项目工作时，只需输入以下命令即可停用环境：
```
deactivate
```

无论你选择了哪种方法，验证库是否正确安装并且可以在 Python 中导入都是一个好习惯。

启动 Python 解释器： 打开你的终端（或 Anaconda Prompt）。如果你使用了虚拟环境，请确保它已激活。输入 python 并按回车键。你应该会看到 Python 提示符 (>>>)。

导入库： 逐一输入以下命令：

import numpy as np
import pandas as pd

print(f"NumPy version: {np.__version__}")
print(f"Pandas version: {pd.__version__}")

你的环境现在已配置完成，你已拥有基本的工具。在下一节中，我们将在 Jupyter Notebook（许多数据科学家偏爱的交互式环境）中运行一些基本代码示例，开始使用这些库。