机器学习与传统编程的区别

为了理解机器学习 (machine learning)的独特之处，有助于先了解传统计算机程序的工作方式。

在传统编程中，开发者分析问题，设计解决方案，然后编写明确的、一步步的指令（代码），告诉计算机如何精确地将输入数据转化为期望的输出。

试想编写一个程序，计算在线购物车中商品的总价，包括销售税。你会编写如下代码：

逻辑完全由程序员定义。程序每次都基于提供的规则执行相同的步骤序列。如果税收规则发生变化，程序员必须手动更新代码。程序不会自行学习或调整；它严格遵循给定的指令。

传统编程工作流程的简化视图。

机器学习反转了这个过程。它不是编写明确的规则，而是向计算机提供大量示例（数据），这些示例体现了输入和期望输出之间的关系。机器学习算法随后从这些数据中学习模式和规则。

以识别垃圾邮件的问题为例。

传统方法： 你可能会尝试编写规则，比如“如果邮件包含‘免费’、‘伟哥’或‘紧急’等词语，则将其标记 (token)为垃圾邮件。”这很快变得难以管理。垃圾邮件发送者不断改变策略，而且合法邮件也可能使用这些词语。维护这些规则是徒劳的。
机器学习方法： 你收集数千封邮件，这些邮件已被标记为“垃圾邮件”或“非垃圾邮件”（正常邮件）。你将这些已标记的示例输入给机器学习算法。算法分析这些示例，并学习那些不易察觉的模式（词语组合、发件人信息、邮件结构等），这些模式倾向于区分垃圾邮件和合法邮件。输出不是一个固定程序，而是一个训练好的模型，它可以预测一封新的、以前未见的邮件是否是垃圾邮件。

核心思想是系统自行学习从输入到输出的映射关系，而不是被明确地编程来完成。

机器学习工作流程的简化视图，包括训练和预测阶段。

机器学习在以下情况下表现出色：

传统编程依赖于人类定义的逻辑，而机器学习则依赖于算法在数据中找到逻辑。这种转变使得计算机能够处理以前被认为过于复杂或动态而无法自动化的问题。

参考文献

Machine Learning, Tom M. Mitchell, 1997 (McGraw Hill) - 一本基础教科书，定义了机器学习及其基本原理，确立了与传统编程的区别。
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems, Aurélien Géron, 2022 (O'Reilly Media) - 一本实用的现代教科书，从基础层面介绍机器学习概念，阐明了机器学习与传统编程之间的区别。
An Introduction to Statistical Learning: With Applications in Python, Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, Jonathan Taylor, 2023 (Springer) DOI: 10.1007/978-1-0716-2495-0 - 一本备受推崇的统计学习入门书籍，涵盖了强调数据驱动方法的机器学习基本概念，并将其与显式规则进行对比。
Machine Learning Course (CS229) Lecture Notes, Andrew Ng, 2008 (Stanford University) - 一份基础机器学习课程的首批讲义，提供了对机器学习定义及其与传统算法区别的易懂概述。