为机器学习任务编写可运行的 Python 代码是一个主要目标。然而,随着项目规模扩大和涉及协作,代码的质量也变得同样重要。难以阅读、执行缓慢或难以修改的代码会极大地妨碍项目进展。本章侧重于那些有助于您编写机器学习 Python 代码的实践和工具,使这些代码不仅正确,而且高效、可读且可维护。我们将涵盖建立清晰的代码风格、逻辑地组织项目,以及编写有效的函数和模块。您将了解如何使用虚拟环境管理项目依赖、使用性能分析工具识别性能瓶颈,以及优化 NumPy 和 Pandas 等常用库的特定方法。此外,我们将介绍用于验证代码组件的单元测试基础知识,以及使用 Git 进行版本控制的基本用法,以有效管理您的代码库。这些技能对于构建可靠且可扩展的机器学习系统是必要的。