趋近智
编写并执行你的第一批 NumPy 和 Pandas 代码是一个重要步骤。这有助于确认库是否正确安装,并让你初步了解它们如何运作。
使用任何 Python 库的第一步是将其 import 到你当前的脚本或 Notebook 会话中。这使得库的函数和对象可供你使用。对于 NumPy 和 Pandas,有一些标准的社区导入惯例:
np 导入。pd 导入。使用这些别名让你的代码更短、更易读,因为它们被广泛认可。
打开你的 Jupyter Notebook(或 Python 解释器)并在一个单元格中输入以下代码:
# 导入 NumPy 库
import numpy as np
# 导入 Pandas 库
import pandas as pd
# 打印确认信息
print("NumPy 和 Pandas 导入成功!")
print(f"NumPy version: {np.__version__}")
print(f"Pandas version: {pd.__version__}")
要在 Jupyter 中运行此代码,请按 Shift + Enter。如果安装成功,你将在单元格下方看到打印的确认信息,以及 NumPy 和 Pandas 的已安装版本。如果你遇到 ModuleNotFoundError 这样的错误信息,请重新检查上一节(“设置你的环境”)中的安装步骤。
NumPy 的主要对象是 N 维数组,通常称为 ndarray。让我们从一个标准的 Python 列表创建一个简单的一维数组。
# 创建一个 Python 列表
my_list = [1, 2, 3, 4, 5]
# 从列表创建一个 NumPy 数组
np_array = np.array(my_list)
# 打印数组
print("我的第一个 NumPy 数组:")
print(np_array)
# 打印数组对象的类型
print("对象的类型:")
print(type(np_array))
运行此单元格将输出:
我的第一个 NumPy 数组:
[1 2 3 4 5]
对象的类型:
<class 'numpy.ndarray'>
注意到输出 [1 2 3 4 5] 与 Python 列表 [1, 2, 3, 4, 5] 略有不同。这表明它是一个 NumPy 数组。type() 函数确认 np_array 确实是 numpy.ndarray 类的一个实例。
NumPy 数组支持高效的逐元素操作。让我们尝试一个简单的:将每个元素乘以 2。
# 执行逐元素操作
doubled_array = np_array * 2
print("乘法运算后的数组:")
print(doubled_array)
输出:
乘法运算后的数组:
[ 2 4 6 8 10]
对于标准的 Python 列表,你需要使用循环或列表推导来完成此操作。NumPy 在后台更高效地处理了这一点。
Pandas 提供了两种主要数据结构:Series(一维)和 DataFrame(二维)。
让我们创建一个 Series。Series 类似于一维 NumPy 数组,但带有关联的索引。
# 从列表创建一个 Pandas Series
data_series = [10, 20, 30, 40, 50]
pd_series = pd.Series(data_series)
# 打印 Series
print("我的第一个 Pandas Series:")
print(pd_series)
# 打印 Series 对象的类型
print("\n对象的类型:")
print(type(pd_series))
运行此单元格将输出:
我的第一个 Pandas Series:
0 10
1 20
2 30
3 40
4 50
dtype: int64
对象的类型:
<class 'pandas.core.series.Series'>
注意到输出左侧包含值(10、20 等)和索引(0、1、2 等)。dtype: int64 表示 Series 中存储值的数据类型。
现在,让我们创建一个 DataFrame。DataFrame 是一种二维的、表格状的结构,其中列可以具有不同的数据类型。一种常见的方法是从 Python 字典创建它,其中键成为列名,值(列表或数组)成为列数据。
# 创建一个数据字典
data_dict = {
'StudentID': [101, 102, 103, 104],
'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Score': [85, 92, 78, 88]
}
# 从字典创建一个 Pandas DataFrame
df = pd.DataFrame(data_dict)
# 打印 DataFrame
print("我的第一个 Pandas DataFrame:")
print(df)
# 打印 DataFrame 对象的类型
print("\n对象的类型:")
print(type(df))
运行此单元格会生成:
我的第一个 Pandas DataFrame:
StudentID Name Score
0 101 Alice 85
1 102 Bob 92
2 103 Charlie 78
3 104 David 88
对象的类型:
<class 'pandas.core.frame.DataFrame'>
此输出清晰地类似于一个带有标签列('StudentID'、'Name'、'Score')的表格和一个自动生成的行索引(0、1、2、3)。
执行这些简单的代码片段确认你的环境已就绪,并让你初步了解如何在 NumPy 和 Pandas 中创建和操作基本数据结构。在接下来的章节中,我们将在此基础上,更详细地研究这些库的功能。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造