章节 4: 语言模型

声学模型可以根据一段音频确定音素的概率，但仅凭这一点不足以实现准确转录。例如，“recognize speech”和“wreck a nice beach”这两个短语听起来可能非常相似。声学模型可能会为这两种解释分配较高的概率。为了解决这种歧义，系统需要明白在给定语言中哪个词序更有可能出现。

本章介绍语言模型，它是负责为识别过程添加语言上下文 (context)的组成部分。通过为词序分配概率，语言模型帮助ASR系统从一组听起来相似的候选中选择最合理的转录。

您将了解以下内容：