所有课程

机器学习入门

章节 1: 什么是机器学习？

定义机器学习

为什么学习机器学习？

机器学习在日常生活中的实例

机器学习与传统编程的区别

机器学习系统种类

机器学习工作流程概述

你会用到的工具

第 1 章测验

章节 2: 核心要点

数据：机器学习的燃料

特征与标签说明

训练集、验证集和测试集

模型：从数据中学习

参数与超参数

过拟合与欠拟合简介

评估性能：基本指标

第 2 章测验

章节 3: 监督学习：回归

了解回归问题

线性回归介绍

线性回归如何学习

成本函数：衡量误差

梯度下降：寻找最佳拟合

简单线性回归示例

实践：实现简单线性回归

第 3 章测验

章节 4: 监督学习：分类

理解分类问题

逻辑回归介绍

K-近邻算法（KNN）介绍

KNN 的运作方式

评估分类模型

实践：实现K近邻分类

第 4 章测验

章节 5: 无监督学习：聚类

什么是无监督学习？

选择聚类数量 (K)

K-Means 如何找到簇群

K-均值算法的局限性

动手操作：K-Means 在简单数据上的应用

第 5 章测验

章节 6: 准备数据

数据预处理的重要性

处理缺失值

特征缩放介绍

编码分类特征

再次谈谈：将数据划分为训练集和测试集

动手实践：基本数据清洗步骤

第 6 章测验

章节 7: 构建你的第一个机器学习模型

回顾：机器学习工作流步骤

选择合适的算法

使用库加载和准备数据

训练一个简单模型

模型表现评估

动手实践：端到端简单模型构建

第 7 章测验

再次谈谈：将数据划分为训练集和测试集

这部分内容有帮助吗？

参考文献

sklearn.model_selection.train_test_split, scikit-learn developers, 2024 - train_test_split函数的官方文档，详细说明其用法、test_size、random_state和stratify等参数以及示例。
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems, Aurélien Géron, 2022 (O'Reilly Media) - 一本实践指南，通过清晰的Python库代码示例，涵盖了数据拆分、模型评估以及其他机器学习基础知识。
The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Trevor Hastie, Robert Tibshirani, and Jerome Friedman, 2017 (Springer) DOI: 10.1007/978-0-387-84858-7 - 一本基础教材，解释了机器学习背后的统计原理，包括模型评估和选择技术，以及泛化的重要性。
Machine Learning Specialization, Andrew Ng, 2022 (DeepLearning.AI and Stanford Online) - 一个入门级专业课程，从对初学者友好的角度介绍了训练集-测试集拆分、过拟合和模型评估等机器学习核心概念。

© 2025 ApX Machine Learning用心打造