趋近智
所有课程
先修课程 Python 及机器学习知识
级别:
音频预处理
为 ASR 模型预处理和准备音频数据。
特征提取
实现 MFCC 和对数梅尔频谱图等特征提取技术。
声学建模
使用 RNN、LSTM 和 Transformer 构建和训练声学模型。
语言建模
将语言模型整合到解码过程中以提高准确率。
系统评估
使用 WER 等标准度量评估和基准测试 ASR 系统性能。
部署
构建实用的语音转文本应用管道。
本课程没有先修课程。
目前没有推荐的后续课程。
登录以撰写评论
分享您的反馈以帮助其他学习者。
© 2025 ApX Machine Learning