所有课程

Scikit-Learn 快速上手

章节 1: Scikit-learn 介绍与环境配置

Scikit-learn 是什么？

安装与环境设置

Scikit-learn API 概述

Scikit-learn 中的数据表示

加载示例数据集

动手实践：安装验证

第 1 章测验

章节 2: 监督学习：回归

回归问题简介

线性回归基本原理

使用Scikit-learn实现线性回归

解释模型系数

回归评估指标

Scikit-learn 中的指标计算

动手实践：构建回归模型

第 2 章测验

章节 3: 监督学习：分类

分类问题介绍

逻辑回归用于分类

K-近邻算法 (KNN)

在 Scikit-learn 中实现 KNN

支持向量机 (SVM) 基本原理

使用Scikit-learn实现SVM

分类评估指标

在 Scikit-learn 中计算指标

实践操作：构建分类模型

第 3 章测验

章节 4: 数据预处理与特征工程

数据预处理的重要性

特征缩放技术

在Scikit-learn中应用缩放器

分类特征编码

在Scikit-learn中应用编码器

处理缺失值

在Scikit-learn中使用填充器

动手实践：数据预处理

第 4 章测验

章节 5: 模型选择与评估

过拟合与欠拟合问题

数据划分：训练集与测试集

交叉验证简介

实现K折交叉验证

分层K折用于分类

网格搜索用于超参数调整

动手实践：模型评估与选择

第 5 章测验

章节 6: 构建管道

使用管道的理由

创建简单管道

访问流水线步骤

使用管道结合交叉验证

使用管道进行网格搜索

使用 ColumnTransformer 构建复杂管道

实战：流水线的构建与调优

第 6 章测验

实现K折交叉验证

这部分内容有帮助吗？

参考文献

The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Trevor Hastie, Robert Tibshirani, and Jerome Friedman, 2009 (Springer) DOI: 10.1007/978-0-387-84858-7 - 一本基础教材，涵盖统计学习的理论和实践，包括对交叉验证在模型评估中的详细解释。
Cross-validation: evaluating estimator performance, Scikit-learn developers, 2024 - Scikit-learn官方用户指南中关于交叉验证的部分，详细说明了K-Fold等多种交叉验证策略，以及KFold类和cross_val_score函数的使用。
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems, Aurélien Géron, 2022 (O'Reilly Media) - 一本实践指南，展示如何使用Scikit-learn库实现K-Fold交叉验证及其他机器学习技术。

© 2025 ApX Machine Learning用心打造