趋近智
我们已经明确,机器学习系统从数据中学习,特别是从数据中的特征(输入)以及有时是标签(输出)中学习。但这种学习过程的成果究竟是什么?这个成果就是我们所说的模型。
可以把机器学习模型看作是对训练数据中发现的规律的一种特定表现。它是通过在数据集上运行机器学习算法而生成的产物。其目的是让这个模型能够掌握输入特征和(如果适用)输出标签之间的潜在联系,从而对新的、未见过的数据做出有用的预测或判断。
核心来说,模型接收你不知道结果的新输入数据(特征),并生成一个输出,通常是预测或判断。
考虑一个简单的例子:想象你正在努力弄清你的学习时间 (x) 和你在考试中获得的分数 (y) 之间的关系。你从几次考试中收集数据(你的训练数据)。机器学习算法是你分析这些数据所用的方法(也许是绘制点并画一条线)。模型是你最终画出的那条具体直线,也许用 y=5x+40 这样的方程来表示。这个方程(模型)体现了你观察到的规律,现在可以用来根据新的学习时间 (x) 预测你的分数 (y)。
学习算法处理训练数据以生成训练好的模型。该模型随后可以对新输入数据进行预测。
这是与上一章中强调的传统编程的一个根本区别。我们不再编写明确的规则(例如 如果电子邮件包含“免费钱”则标记为垃圾邮件),而是提供数据,让算法学习构成模型的规则或规律。这些规律的复杂程度可以从我们学习示例中的简单线性方程,到能够识别图像或翻译语言的非常复杂的结构。
区分算法和模型会很有帮助:
你在数据上使用算法来训练模型。这个训练好的模型随后会被保存,并用于未来的预测。在接下来的章节中,我们会更详细地了解模型如何通过调整其内部设置(称为参数)来实际学习,以及我们如何使用超参数配置学习过程。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造