趋近智
在上一节中,我们明确了机器学习模型从数据中学习规律。但模型到底学到了什么,我们又如何控制这个学习过程呢?这引出了与模型相关的两种基本类型的设置:参数和超参数。了解它们之间的区别对于有效地训练和调优模型非常必要。
参数是模型的内部变量,其值直接从训练数据中估算或学得。可以把它们想象成模型在训练过程中自动调整的旋钮和表盘,目的是使误差最小化并做出更好的预测。这些变量捕捉了数据中发现的模式。
机器学习模型从数据中学习模式。模型究竟学习了什么,以及如何控制其学习过程?与模型相关的两种主要设置是参数和超参数。理解它们之间的差异对于有效训练和调整模型非常重要。例如,考虑一个试图将直线拟合到数据点上的简单线性回归模型,直线的方程通常写作 。
在训练过程中,线性回归算法会迭代地调整 和 的值,以找到最能代表训练数据中输入 () 和输出 () 之间关系的直线。最终学得的 和 值定义了通过训练过程产生的特定模型。
参数的其他例子包括:
主要理解点是,参数是由算法本身从数据中学习的。你无需手动设置它们的值;训练过程会决定它们。
另一方面,超参数是外部于模型的配置设置,其值无法从数据中估算。它们由机器学习实践者在训练过程开始之前设置。可以把它们看作更高层次的控制,用于定义学习过程本身应如何运作或限制模型的复杂度。
你不能仅仅通过查看数据就知晓最佳超参数值;它们通常需要实验和调优(我们稍后会提及的一个过程)。
让我们考虑一些与课程大纲中提到的算法相关的例子:
其他例子包括神经网络中的层数或神经元数量、要使用的正则化类型(一种防止过拟合的技术),或决策树的最大深度。
区分参数和超参数很重要:
| 特点 | 参数 | 超参数 |
|---|---|---|
| 来源 | 训练时从数据中学习 | 训练开始前手动设置 |
| 作用 | 定义特定模型的预测逻辑 | 配置训练过程、模型结构 |
| 确定方式 | 由学习算法估算 | 由实践者选择(通常通过调优) |
| 例子 | 系数(线性回归)、权重(神经网络) | 学习率、K(在KNN/K均值中)、树深度 |
超参数控制着学习算法的整体行为和能力。找到好的超参数对实现良好的模型性能通常非常重要。你通常会尝试超参数的不同组合,为每种组合训练单独的模型,并评估它们(通常使用验证集,如前所述),以找到最适合你特定问题和数据的设置。
总而言之,参数是模型从数据中学习的,而超参数则由你设置,以指导模型如何学习。两者都是构建和优化机器学习模型不可或缺的部分。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造