趋近智
一个功能正常的Python环境,配备在数据科学和机器学习中广泛使用的标准库,是进行实践操作的基础。Python因其易读性、丰富的库和活跃的社区支持,已成为这些方面的首选语言。提供设置这些所需工具的指导。
我们强烈推荐使用Anaconda发行版或其轻量级版本Miniconda。Anaconda捆绑了Python与许多流行的数据科学软件包,并包含conda——一个强大的包和环境管理器。使用conda有助于管理依赖项并隔离你的项目环境,从而避免不同项目可能需要同一库的不同版本所引起的冲突。这比直接将包安装到系统基础Python环境中要好得多。
conda init来初始化Anaconda。一般建议选择“是”,以便conda在你的终端中随时可用。在Windows上,Anaconda Prompt将添加到你的“开始”菜单。conda --version。如果安装成功,它会显示已安装的conda版本。虽然Anaconda默认安装了许多包,但我们将在本课程中大量使用的核心库是:
如果你安装了Miniconda,或者由于某些原因你的Anaconda安装中缺少这些库,你可以使用终端或Anaconda Prompt中的conda命令进行安装:
conda install numpy pandas matplotlib seaborn jupyterlab
Conda将确定这些包及其依赖项的兼容版本,并在安装前征求你的确认。
库安装完成后,你可以启动JupyterLab环境。打开你的终端或Anaconda Prompt,切换到你希望存放课程文件的目录(你可以使用cd path/to/your/directory之类的命令),然后运行:
jupyter lab
此命令应在你的网页浏览器中打开一个新标签页,显示JupyterLab界面。在此处,你可以创建新的notebook(.ipynb文件),在单元格中编写和执行Python代码,使用Markdown添加解释性文本,并在notebook中直接查看结果和可视化内容。这个交互式环境非常适合本课程中的动手实践练习。
为了确认核心库已正确安装,请创建一个新的Jupyter notebook并在一个单元格中运行以下代码:
import numpy as np
import pandas as pd
import matplotlib as mpl
import seaborn as sns
print(f"NumPy 版本: {np.__version__}")
print(f"Pandas 版本: {pd.__version__}")
print(f"Matplotlib 版本: {mpl.__version__}")
print(f"Seaborn 版本: {sns.__version__}")
如果代码无错误运行并显示每个库的版本号,则你的环境已准备就绪。你现在拥有了加载数据并执行我们将在后续章节中讲解的统计分析所需的工具。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造