所有课程

Julia 语言用于机器学习

章节 1: Julia 机器学习入门

Julia 用于机器学习的理由？优势与对比

配置您的 Julia 机器学习环境

Julia 的类型系统与多重分派在科学计算中的应用

数据操作所需的核心 Julia 语法

在 Julia 中使用数组和矩阵

DataFrames.jl 简介

使用 Pkg.jl 进行包管理

实践操作：环境配置与基本数据处理

章节 2: Julia 中的数据处理与准备

使用 DataFrames.jl 加载和保存数据

数据清洗：处理缺失值和异常值

数据转换：缩放、编码和分箱

特征工程原则

在 Julia 中应用特征工程

使用 Plots.jl 和 Makie.jl 进行数据可视化

动手实践：数据清洗与特征创建

章节 3: 实现监督学习算法

MLJ.jl 生态系统概述

使用 MLJ.jl 构建和训练线性模型

实现决策树和集成方法

使用 Julia 包实现支持向量机 (SVM)

模型评估指标：准确率、精确率、召回率、F1分数

MLJ.jl 中的交叉验证和超参数调优

监督模型的训练与评估：动手实践

章节 4: 无监督学习与降维

使用K-均值算法在Julia中进行聚类

基于密度的聚类：DBSCAN

主成分分析 (PCA) 用于降维

其他降维方法

评估聚类效果

动手实践：应用聚类与PCA

章节 5: 构建机器学习流水线与工作流程

MLJ 管道介绍

构建预处理和模型管道

保存和加载训练好的模型和管道

组合与调整复杂工作流

Julia 中可重现机器学习实验的策略

动手实践：构建和管理机器学习流水线

章节 6: Flux.jl 深度学习入门

神经网络基本原理

Flux.jl 入门：张量与层

构建前馈神经网络

定义损失函数与优化器

在 Flux.jl 中训练神经网络

使用 Zygote.jl 的自动微分

动手实践：搭建和训练一个简单的神经网络

评估聚类效果

这部分内容有帮助吗？

参考文献

Introduction to Data Mining, Pang-Ning Tan, Michael Steinbach, and Vipin Kumar, 2005 (Pearson Education) - 提供数据挖掘的全面概述，包括聚类算法和各种评估技术（如内部和外部度量）以及选择聚类数量的方法的详细讨论。
Silhouettes: A graphical aid to the interpretation and validation of cluster analysis, Peter J. Rousseeuw, 1987 Journal of Computational and Applied Mathematics, Vol. 20 (Elsevier) DOI: 10.1016/0377-0427(87)90125-7 - 提出轮廓系数的原始研究论文，该系数用于根据簇内和簇间内聚性与分离性评估聚类质量。
A cluster separation measure, David L. Davies, Donald W. Bouldin, 1979 IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. PAMI-1 (IEEE) DOI: 10.1109/TPAMI.1979.4766909 - 定义戴维森-堡丁指数的开创性论文，该指数是一种通过考虑簇内散度和簇间距离来评估聚类效果的内部度量。
Clustering.jl Documentation, JuliaStats, 2022 - Julia Clustering.jl 包的官方文档，提供各种聚类算法和评估指标（包括轮廓分数、兰德指数和互信息）的 API 细节。

© 2025 ApX Machine Learning用心打造