趋近智
声学模型可以根据一段音频确定音素的概率,但仅凭这一点不足以实现准确转录。例如,“recognize speech”和“wreck a nice beach”这两个短语听起来可能非常相似。声学模型可能会为这两种解释分配较高的概率。为了解决这种歧义,系统需要明白在给定语言中哪个词序更有可能出现。
本章介绍语言模型,它是负责为识别过程添加语言上下文的组成部分。通过为词序分配概率,语言模型帮助ASR系统从一组听起来相似的候选中选择最合理的转录。
您将了解以下内容:
4.1 什么是语言模型?
4.2 语音中的歧义问题
4.3 N-gram 语言模型:二元语法和三元语法
4.4 词语序列概率的计算
4.5 困惑度详解
4.6 语言模型如何提高准确性
4.7 神经网络语言模型简介
© 2026 ApX Machine Learning用心打造