人工智能 (AI) 是一个你可能在很多场合都听过的词,从科幻电影到科技新闻报道。它是现代计算领域的一个根本性概念。但它到底指什么,其真实含义又是什么呢?简单来说,人工智能是指计算机科学的一个分支,致力于构建能够执行通常需要人类智能的任务的系统。这些任务包括学习、推理、解决问题、感知、决策,以及对本课程很关键的理解和生成人类语言。可以这样理解:人类从经验中学习,识别模式,做出判断,并进行交流。AI的目标是建造能够模拟这些能力的机器。AI 的主要思想模拟智能: 主要目的是创建能表现出智能行为的非生物系统。这不一定意味着像电影里那样创造有意识的机器;通常,它指的是构建在特定任务上表现非常好的系统,而这些任务过去只能由人类完成。从数据中学习: 现代AI的很大一部分涉及机器学习(ML)。ML算法不是为每种可能的情况编写明确的规则,而是允许计算机从数据中学习模式并做出预测。大型语言模型大量依赖这一原理,从海量文本数据中学习。解决问题: AI系统通常被设计用来解决特定问题,无论是规划路线、识别图像中的物体,还是翻译语言。交互: 许多AI系统被设计为与人类或环境进行交互。正是在这里,语言理解和生成变得必不可少,构成了自然语言处理(NLP)的基础,我们接下来将讨论NLP。范围宽泛,应用具体AI 是一个非常广泛的领域,包含许多子学科和技术。机器学习就是其中一个子学科,自然语言处理是另一个方面,通常与ML有显著交集。大型语言模型则处于这些领域的交汇点。digraph G { rankdir=TB; node [shape=box, style="rounded,filled", fillcolor="#e9ecef", fontname="Arial"]; edge [fontname="Arial"]; AI [label="人工智能 (AI)\n(模拟人类智能)", fillcolor="#a5d8ff"]; ML [label="机器学习 (ML)\n(从数据中学习)", fillcolor="#bac8ff"]; NLP [label="自然语言处理 (NLP)\n(理解/生成语言)", fillcolor="#d0bfff"]; LLM [label="大型语言模型 (LLMs)\n(本课程重点)", fillcolor="#ffec99"]; AI -> ML [label=" 的子集"]; AI -> NLP [label=" 包含"]; ML -> LLM [label=" 使能"]; NLP -> LLM [label=" 重点方向"]; }AI、机器学习(ML)、自然语言处理(NLP)和大型语言模型(LLM)之间的关系。认识到AI并非单一技术,而是一个概括性术语,这很重要。早期的AI更侧重于基于规则的系统(例如专家系统),而当代AI,特别是与大型语言模型相关的类型,则主要由应用于大型数据集的机器学习驱动。将AI理解为模拟智能行为的这项整体工作,有助于理解为什么大型语言模型(它们专门处理语言使用的智能行为)被认为是该领域的一项重要进展。在下一节中,我们将把重点放在自然语言处理上,这是AI中涉及语言的具体方面。