趋近智
在之前的章节中,我们的工作主要围绕监督学习 (supervised learning)展开。在这种学习中,算法从包含已知结果或标签的数据中进行学习。本章将重心转向无监督学习 (unsupervised learning)。机器学习 (machine learning)的这个分支处理没有预定义标签的数据集。在此,目标是让算法自主找出数据中的模式、结构或关联。
我们还将讨论降维。具有许多特征的数据集可能在建模和计算方面带来挑战。降维技术旨在减少输入变量的数量,同时保留数据中有用的属性。这可以带来更简单的模型、更快的计算,并能通过将数据投影到低维空间来辅助数据可视化,例如从 到 或 。
在本章中,您将学习如何在 Julia 中实现几种常用的无监督学习算法。我们将介绍聚类方法,例如 K-均值 (K-Means),它将数据划分成指定数量 的簇;以及 DBSCAN,一种基于密度的方法。此外,您还将使用主成分分析 (PCA),这是一种常用的数据降维技术。最后,我们将审视评估聚类结果表现的方法。
4.1 使用K-均值算法在Julia中进行聚类
4.2 基于密度的聚类:DBSCAN
4.3 主成分分析 (PCA) 用于降维
4.4 其他降维方法
4.5 评估聚类效果
4.6 动手实践:应用聚类与PCA
© 2026 ApX Machine Learning用心打造