所有课程

模型评估与衡量指标要点

章节 1: 模型评估简介

什么是机器学习模型？

为何模型评估很重要

评估指标的目标

学习问题的类型：分类

学习问题类型：回归

模型评估过程概述

第 1 章测验

章节 2: 分类模型指标

理解分类预测

准确率：一个简单的起始指标

准确率何时会产生误导

真正例、假正例、真反例、假反例

混淆矩阵解析

精确率：衡量预测的准确程度

召回率（敏感度）：衡量完整性

精确率与召回率的权衡

F1分数：结合精确率和召回率

实践：计算分类指标

第 2 章测验

章节 3: 回归模型的评估指标

理解回归预测

计算预测误差

平均绝对误差 (MAE)

均方误差 (MSE)

均方根误差 (RMSE)

比较平均绝对误差 (MAE)、均方误差 (MSE) 和均方根误差 (RMSE)

决定系数 (R平方)

解释R平方值

R平方的局限性

练习：计算回归指标

第 3 章测验

章节 4: 为评估准备数据

为何在新数据上评估模型？

训练集：学习模式

测试集：评估性能

训练-测试集划分步骤

常用划分比例

数据分割中的随机性

单一划分可能存在的问题

交叉验证方法简介

动手实践：数据分割

第 4 章测验

章节 5: 简单评估流程

标准评估的步骤

为你的问题选择评估指标

执行训练-测试集划分

训练一个简单模型

在测试集上生成预测

计算性能指标

结果的解读

简单的评估流程示例

基础评估中的常见错误

第 5 章测验

交叉验证方法简介

这部分内容有帮助吗？

参考文献

The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Trevor Hastie, Robert Tibshirani, and Jerome Friedman, 2009 (Springer) - 本书为交叉验证和各种模型评估技术提供了严谨的统计和理论背景。
Machine Learning Yearning, Andrew Ng, 2018 - 提供模型评估的实用建议，包括在机器学习项目中有效使用交叉验证。
Cross-validation: evaluating estimator performance, scikit-learn developers, 2024 - scikit-learn官方用户指南解释了各种交叉验证策略及其在Python中的实际实现。
CS229 Lecture Notes: Machine Learning, Andrew Ng, 2018 (Stanford University) - 这份来自广受认可的机器学习课程的讲义讨论了交叉验证作为模型选择和性能估计的方法。

© 2025 ApX Machine Learning用心打造