趋近智
为了理解机器学习 (machine learning)的独特之处,有助于先了解传统计算机程序的工作方式。
在传统编程中,开发者分析问题,设计解决方案,然后编写明确的、一步步的指令(代码),告诉计算机如何精确地将输入数据转化为期望的输出。
试想编写一个程序,计算在线购物车中商品的总价,包括销售税。你会编写如下代码:
逻辑完全由程序员定义。程序每次都基于提供的规则执行相同的步骤序列。如果税收规则发生变化,程序员必须手动更新代码。程序不会自行学习或调整;它严格遵循给定的指令。
传统编程工作流程的简化视图。
机器学习反转了这个过程。它不是编写明确的规则,而是向计算机提供大量示例(数据),这些示例体现了输入和期望输出之间的关系。机器学习算法随后从这些数据中学习模式和规则。
以识别垃圾邮件的问题为例。
传统方法: 你可能会尝试编写规则,比如“如果邮件包含‘免费’、‘伟哥’或‘紧急’等词语,则将其标记 (token)为垃圾邮件。”这很快变得难以管理。垃圾邮件发送者不断改变策略,而且合法邮件也可能使用这些词语。维护这些规则是徒劳的。
机器学习方法: 你收集数千封邮件,这些邮件已被标记为“垃圾邮件”或“非垃圾邮件”(正常邮件)。你将这些已标记的示例输入给机器学习算法。算法分析这些示例,并学习那些不易察觉的模式(词语组合、发件人信息、邮件结构等),这些模式倾向于区分垃圾邮件和合法邮件。输出不是一个固定程序,而是一个训练好的模型,它可以预测一封新的、以前未见的邮件是否是垃圾邮件。
核心思想是系统自行学习从输入到输出的映射关系,而不是被明确地编程来完成。
机器学习工作流程的简化视图,包括训练和预测阶段。
| 特征 | 传统编程 | 机器学习 (machine learning) |
|---|---|---|
| 核心方法 | 人类编码的明确规则 | 算法从数据中学习规则 |
| 输入 | 数据 | 数据 + 期望输出(通常) |
| 过程 | 程序执行预定义指令 | 算法在数据中发现模式 |
| 输出 | 计算结果 | 训练好的模型 |
| 适应性 | 需要手动更改代码 | 可适应新的数据模式(通过再训练) |
| 问题适用性 | 逻辑明确,规则固定 | 复杂模式,预测,适应 |
机器学习在以下情况下表现出色:
传统编程依赖于人类定义的逻辑,而机器学习则依赖于算法在数据中找到逻辑。这种转变使得计算机能够处理以前被认为过于复杂或动态而无法自动化的问题。
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•