所有课程

机器学习入门

章节 1: 什么是机器学习？

定义机器学习

为什么学习机器学习？

机器学习在日常生活中的实例

机器学习与传统编程的区别

机器学习系统种类

机器学习工作流程概述

你会用到的工具

第 1 章测验

章节 2: 核心要点

数据：机器学习的燃料

特征与标签说明

训练集、验证集和测试集

模型：从数据中学习

参数与超参数

过拟合与欠拟合简介

评估性能：基本指标

第 2 章测验

章节 3: 监督学习：回归

了解回归问题

线性回归介绍

线性回归如何学习

成本函数：衡量误差

梯度下降：寻找最佳拟合

简单线性回归示例

实践：实现简单线性回归

第 3 章测验

章节 4: 监督学习：分类

理解分类问题

逻辑回归介绍

K-近邻算法（KNN）介绍

KNN 的运作方式

评估分类模型

实践：实现K近邻分类

第 4 章测验

章节 5: 无监督学习：聚类

什么是无监督学习？

选择聚类数量 (K)

K-Means 如何找到簇群

K-均值算法的局限性

动手操作：K-Means 在简单数据上的应用

第 5 章测验

章节 6: 准备数据

数据预处理的重要性

处理缺失值

特征缩放介绍

编码分类特征

再次谈谈：将数据划分为训练集和测试集

动手实践：基本数据清洗步骤

第 6 章测验

章节 7: 构建你的第一个机器学习模型

回顾：机器学习工作流步骤

选择合适的算法

使用库加载和准备数据

训练一个简单模型

模型表现评估

动手实践：端到端简单模型构建

第 7 章测验

K-Means 算法

这部分内容有帮助吗？

参考文献

Some Methods for Classification and Analysis of Multivariate Observations, J. B. MacQueen, 1967 Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1: Statistics, Vol. 1 (University of California Press) - 介绍了用于寻找聚类中心的迭代算法，该算法后来被称为K-Means。
Pattern Recognition and Machine Learning, Christopher M. Bishop, 2006 (Springer) - 对K-Means及相关聚类算法进行了全面且基于概率的论述。
CS229 Lecture Notes: Unsupervised Learning, Andrew Ng, 2008 (Stanford University) - 作为一种基础的无监督学习算法，对K-Means进行了清晰的解释。
k-means++: The Advantages of Careful Seeding, David Arthur, Sergei Vassilvitskii, 2007 Proceedings of the Eighteenth Annual ACM-SIAM Symposium on Discrete Algorithms (Society for Industrial and Applied Mathematics) DOI: 10.5555/1283383.1283494 - 介绍了一种改进的K-Means初始化方法，以获得更好的聚类结果并加快收敛速度。
sklearn.cluster.KMeans, scikit-learn developers, 2024 - 提供了scikit-learn中K-Means实现的实际用法、参数和属性的官方文档。

© 2025 ApX Machine Learning用心打造