趋近智
这个动手练习将引导你安装 NumPy 和 Pandas 库(如果尚未安装),并通过在 Jupyter Notebook 中运行一些基础代码来确认一切正常运行。
根据你选择直接使用 Anaconda 还是 pip,安装步骤会略有不同。
Anaconda 简化了包管理。如果你按照“设置你的环境”部分的建议安装了 Anaconda,你很可能已经安装了 NumPy、Pandas 和 Jupyter。不过,我们还是来明确地确认或安装它们。
打开 Anaconda Prompt(或 macOS/Linux 上的终端):
安装/更新库: 确保你拥有最新版本是个好习惯。执行以下命令:
conda install numpy pandas jupyterlab
Conda 会检查这些包是否已安装,如果必要则更新它们,或者如果它们缺失则安装它们。它还会自动处理安装任何所需的依赖项。你可能会被提示确认安装计划;如果是,请输入 y 并按回车键。
验证安装(可选): 你可以列出 Conda 管理的已安装包来检查:
conda list numpy pandas
此命令应显示 NumPy 和 Pandas 的已安装版本。
如果你使用 pip(Python 的标准包安装器)直接管理你的 Python 环境,请按照以下步骤操作。
打开终端或命令提示符:
安装库: 使用 pip 安装 NumPy、Pandas 和 JupyterLab(包含 Jupyter Notebook):
pip install numpy pandas jupyterlab
注意: 根据你的系统配置,你可能需要使用 pip3 而不是 pip,特别是如果你同时安装了 Python 2 和 Python 3。在某些系统上,特别是 Linux 和 macOS,使用 python -m pip install ... 是一种更可靠的方式,可以确保你使用的是与你预期 Python 解释器关联的 pip。
验证安装(可选): 你可以使用 pip 显示已安装包的详细信息:
pip show numpy pandas
如果 NumPy 和 Pandas 包成功安装,此命令将显示它们的信息。
库安装好后,让我们启动 JupyterLab,这是我们将在整个课程中使用的交互式环境。
cd(更改目录)命令导航到你希望保存本课程笔记本的文件夹。例如:
cd path/to/your/projects/essential-numpy-pandas
将 path/to/your/projects/essential-numpy-pandas 替换为你计算机上的实际路径。在特定的项目文件夹中工作有助于使你的文件井井有条。jupyter lab
此命令将启动 JupyterLab 服务器。你的默认网页浏览器应自动打开,显示 JupyterLab 界面。如果它没有自动打开,终端将提供一个 URL(通常以 http://localhost:8888/lab 开头),你可以复制并粘贴到浏览器的地址栏中。保持终端窗口运行;关闭它将关闭 Jupyter 服务器。
现在,让我们创建一个笔记本并运行一些代码来确认 NumPy 和 Pandas 已经准备就绪。
创建新笔记本: 在 JupyterLab 界面中(它在你的浏览器中打开),查找“启动器”选项卡。在“笔记本”下,点击“Python 3”内核图标(根据你的设置,它可能有一个稍微不同的名称,如“Python [conda env:base]”)。这将创建一个并打开一个新的、未命名的笔记本文件(.ipynb)。
重命名笔记本(可选但推荐): 点击笔记本区域顶部的“Untitled.ipynb”名称,并将其重命名为有描述性的名称,例如 01-Setup-Verification.ipynb。
输入并运行 NumPy 代码: 在第一个代码单元格(旁边带有 [ ]: 的框)中,输入以下 Python 代码:
import numpy as np
# Create a simple NumPy array
my_array = np.array([1, 2, 3, 4, 5])
# Print the array
print("My first NumPy array:")
print(my_array)
# Print the shape of the array
print("Array shape:")
print(my_array.shape)
要运行此单元格中的代码,请点击单元格内部并按下 Shift + Enter。
验证 NumPy 输出: 在单元格下方,你应该看到输出:
My first NumPy array:
[1 2 3 4 5]
Array shape:
(5,)
看到此输出确认 NumPy 已正确安装并正常运行。import numpy as np 行导入该库,通常为其赋予别名 np。然后我们创建了一个简单的 1 维数组并打印它,以及它的形状(沿着一个维度有 5 个元素)。
输入并运行 Pandas 代码: 输出下方应出现一个新的代码单元格。如果没有,点击笔记本工具栏中的 + 按钮。在这个新单元格中,输入以下代码:
import pandas as pd
# Create a simple Pandas Series
my_series = pd.Series({'a': 10, 'b': 20, 'c': 30})
# Print the Series
print("My first Pandas Series:")
print(my_series)
按下 Shift + Enter 运行此单元格。
验证 Pandas 输出: 你应该看到以下输出:
My first Pandas Series:
a 10
b 20
c 30
dtype: int64
此输出确认 Pandas 也已安装并正常运行。我们使用约定俗成的别名 pd 导入它,并从 Python 字典创建了一个基本的 Series(一维带标签数组)。
如果你在安装或运行代码时遇到错误:
conda 或 pip,这可能意味着 Anaconda 或 Python 在安装过程中没有添加到你系统的 PATH 环境变量中。请重新查看你操作系统的安装说明,或尝试再次运行安装,确保你选择将它添加到 PATH 的选项(如果可用且适合你的设置)。No module named 'numpy' 或 No module named 'pandas'),则安装可能失败,或者你可能正在使用与安装库时不同的 Python 环境运行笔记本。确保你在执行安装的相同环境(例如,相同的 Anaconda Prompt/终端会话)中运行 jupyter lab。请再次尝试安装命令。np.__version__ 和 pd.__version__ 检查版本。成功运行这些简单的代码片段意味着你的环境已正确配置 NumPy 和 Pandas,并且你熟悉在 Jupyter Notebook 中执行代码的基本知识。你现在可以继续学习后续章节,并开始使用这些功能强大的库了。记住保存你的笔记本(文件 -> 保存笔记本或 Ctrl+S/Cmd+S),你也可以通过回到运行 jupyter lab 的终端窗口并按两次 Ctrl + C 来关闭 Jupyter 服务器。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造