所有课程

机器学习应用中级Python编程

章节 1: 进阶Python结构用于数据科学

Python 基础知识回顾

列表推导式和生成器表达式

使用迭代器和生成器

高级函数参数

代码重用性中的装饰器

用于资源管理的上下文管理器

机器学习中的面向对象编程原则

错误处理与异常管理

实践：应用高级Python技术

第 1 章测验

章节 2: NumPy 数值计算

NumPy 数组简介

数组创建方法

NumPy 数组的索引与切片

数组计算与通用函数

广播规则及应用

NumPy 中的线性代数运算

NumPy中的统计函数

读取和写入数组数据到文件

动手实践：NumPy 数组操作

第 2 章测验

章节 3: Pandas 数据操作

Pandas数据结构简介

从多种来源加载数据

数据索引与选择

处理缺失数据

数据清洗与数据转换技巧

分组和聚合操作

合并、连接和拼接数据帧

Pandas中的时间序列数据处理

实践：使用 Pandas 整理数据

第 3 章测验

章节 4: 使用 Matplotlib 和 Seaborn 进行数据可视化

Matplotlib 绘图基本原理

创建常用图表类型

图表自定义

用于统计数据可视化的 Seaborn 简介

使用 Seaborn 创建高级图表

分布与关系的可视化

保存绘图用于报告和演示文稿

动手实践：数据可视化查看

第 4 章测验

章节 5: 为机器学习准备数据

机器学习工作流程概览

特征工程原理

处理分类数据

特征缩放和标准化方法

将数据划分为训练集和测试集

Scikit-learn 管道介绍

保持数据变换的一致性

实践：构建数据准备管道

第 5 章测验

章节 6: 为机器学习编写高效且可维护的 Python 代码

代码风格与可读性

机器学习项目结构化

编写高效的函数和模块

虚拟环境简介

Python 代码性能分析

优化 NumPy 和 Pandas 的方法

机器学习单元测试介绍

Git 版本控制基础

实践：重构与优化机器学习代码片段

第 6 章测验

保持数据变换的一致性

这部分内容有帮助吗？

参考文献

Preprocessing data, scikit-learn developers, 2023 (scikit-learn) - Scikit-learn预处理模块和管道的官方指南，展示了数据转换的正确使用模式，并防止数据泄露。
Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems, Aurélien Géron, 2022 (O'Reilly Media) - 使用 Scikit-learn 进行机器学习的实用指南，包含数据预处理、特征缩放以及通过管道防止数据泄露的具体示例。
An Introduction to Statistical Learning: With Applications in R, Gareth James, Daniela Witten, Trevor Hastie, Rob Tibshirani, 2021 (Springer) - 统计学习方法的基础文本，讲解了数据划分的原则以及独立评估的重要性，以避免对模型性能的过度乐观估计。
Feature Engineering for Machine Learning: Principles and Techniques for Data Scientists, Alice Zheng and Amanda Casari, 2018 (O'Reilly Media) - 专门关于特征工程策略的资源，概述了在训练集和测试集之间保持转换一致性，同时进行数据准备的方法。

© 2025 ApX Machine Learning用心打造