所有课程

机器学习应用中级Python编程

章节 1: 进阶Python结构用于数据科学

Python 基础知识回顾

列表推导式和生成器表达式

使用迭代器和生成器

高级函数参数

代码重用性中的装饰器

用于资源管理的上下文管理器

机器学习中的面向对象编程原则

错误处理与异常管理

实践：应用高级Python技术

第 1 章测验

章节 2: NumPy 数值计算

NumPy 数组简介

数组创建方法

NumPy 数组的索引与切片

数组计算与通用函数

广播规则及应用

NumPy 中的线性代数运算

NumPy中的统计函数

读取和写入数组数据到文件

动手实践：NumPy 数组操作

第 2 章测验

章节 3: Pandas 数据操作

Pandas数据结构简介

从多种来源加载数据

数据索引与选择

处理缺失数据

数据清洗与数据转换技巧

分组和聚合操作

合并、连接和拼接数据帧

Pandas中的时间序列数据处理

实践：使用 Pandas 整理数据

第 3 章测验

章节 4: 使用 Matplotlib 和 Seaborn 进行数据可视化

Matplotlib 绘图基本原理

创建常用图表类型

图表自定义

用于统计数据可视化的 Seaborn 简介

使用 Seaborn 创建高级图表

分布与关系的可视化

保存绘图用于报告和演示文稿

动手实践：数据可视化查看

第 4 章测验

章节 5: 为机器学习准备数据

机器学习工作流程概览

特征工程原理

处理分类数据

特征缩放和标准化方法

将数据划分为训练集和测试集

Scikit-learn 管道介绍

保持数据变换的一致性

实践：构建数据准备管道

第 5 章测验

章节 6: 为机器学习编写高效且可维护的 Python 代码

代码风格与可读性

机器学习项目结构化

编写高效的函数和模块

虚拟环境简介

Python 代码性能分析

优化 NumPy 和 Pandas 的方法

机器学习单元测试介绍

Git 版本控制基础

实践：重构与优化机器学习代码片段

第 6 章测验

处理分类数据

这部分内容有帮助吗？

参考文献

Preprocessing data, scikit-learn developers, 2023 - Scikit-learn中数据转换的基本指南，涵盖了OrdinalEncoder、OneHotEncoder以及在管道中使用ColumnTransformer进行分类特征处理。
Working with categorical data, pandas development team, 2023 - 详细解释了如何在Pandas中处理分类数据类型，包括使用get_dummies进行映射和独热编码的方法。
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, Aurélien Géron, 2022 (O'Reilly Media) - 第三版实践指南，涵盖数据预处理，包括使用Python的Scikit-learn和Pandas库进行分类特征编码技术。
Categorical Feature Encoding for Tabular Data: A Survey, Meng Zhang, Yanan Song, Wenjun Mao, Guohua Cao, and Shijie Hao, 2023 IEEE Transactions on Knowledge and Data Engineering, Vol. 35 (IEEE) DOI: 10.1109/TKDE.2022.3204918 - 对各种分类特征编码方法进行了全面回顾，讨论了它们的优缺点以及在不同机器学习场景中的适用性。

© 2025 ApX Machine Learning用心打造