所有课程

高级语音识别与合成

章节 1: 现代语音处理流程的核心组成

高级音频特征提取

语音统计建模回顾

序列的深度学习结构

ASR 系统组成部分

文本转语音（TTS）系统的组成部分

评估指标的再审视

章节 2: 高级ASR声学建模

混合HMM-DNN系统

联结主义时间分类 (CTC)

注意力机制的编码器-解码器模型

RNN 转导器 (RNN-T)

用于自动语音识别的Transformer架构

高级训练方法

解码算法比较

动手实践：构建一个端到端ASR模型

章节 3: ASR中的语言建模与适应

ASR中的神经网络语言模型

浅层集成与深度集成

说话人适应技术

环境与信道适应

自动语音识别中的无监督和半监督学习

多语言和跨语言自动语音识别

实践：使用适应数据微调ASR

章节 4: 高级文本到语音合成

自回归声学模型 (Tacotron, Transformer TTS)

非自回归声学模型 (FastSpeech, ParaNet)

基于流的文本到语音合成模型

生成对抗网络（GANs）在文本到语音中的应用

韵律建模与控制

富有表现力的语音合成

声音克隆与转换

动手实践：训练高级TTS模型

章节 5: 神经网络声码器与波形生成

传统声码器的不足之处

自回归波形模型（WaveNet, WaveRNN）

基于流的声码器 (WaveGlow, FloWaveNet)

基于GAN的声码器（MelGAN, HiFi-GAN）

用于声码器的扩散模型

神经网络声码器的条件化

合成音频质量评估

动手实践：使用神经声码器

章节 6: 优化、部署与工具集

语音模型量化

模型剪枝与稀疏化

ASR/TTS 的知识蒸馏

优化推理引擎（ONNX Runtime, TensorRT）

流式ASR的部署考量

实时文本转语音（TTS）的部署考虑

语音处理工具包（ESPnet, NeMo, Coqui）概述

实践：优化语音模型

基于流的声码器 (WaveGlow, FloWaveNet)

这部分内容有帮助吗？

参考文献

WaveGlow: A Flow-based Generative Network for Speech Synthesis, Ryan Prenger, Rafael Valle, Bryan Catanzaro, 2019 ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) DOI: 10.48550/arXiv.1811.00002 - 介绍了WaveGlow架构及其在语音合成中的应用，实现了并行生成。
Glow: Generative Flow with Invertible 1x1 Convolutions, Diederik P. Kingma, Prafulla Dhariwal, 2018 Advances in Neural Information Processing Systems (NeurIPS 2018) (Neural Information Processing Systems Foundation) DOI: 10.48550/arXiv.1807.03039 - 介绍了Glow模型，WaveGlow在此基础上进行改进，其特点是使用了仿射耦合层和可逆1x1卷积来实现生成流。
FloWaveNet: A Generative Flow for Raw Audio, Taejun Kim, Hyoung-Seok Kwon, Jae-Sung Bae, Kyeong-Jin Mun, Kook-Cho Roh, 2019 Proc. Interspeech 2019 (International Speech Communication Association (ISCA)) DOI: 10.21437/Interspeech.2019-2169 - 描述了FloWaveNet，本节中提到的另一种基于流的声码器架构，专为原始音频生成设计。
Density Estimation using Real NVP, Laurent Dinh, Jascha Sohl-Dickstein, Samy Bengio, 2017 International Conference on Learning Representations (ICLR 2017) DOI: 10.48550/arXiv.1605.08803 - 介绍了Real NVP，一个使用仿射耦合层的归一化流模型，仿射耦合层是本节中讨论的基于流模型的核心组件。

© 2025 ApX Machine Learning用心打造