趋近智
先修课程 扎实的机器学习/深度学习及Python基础。
级别:
高级ASR架构
实现并分析复杂的端到端ASR模型,例如基于注意力的编解码器和Transducers。
说话人与环境适应
应用技术使ASR模型适应不同的说话人、口音和声学环境。
高级TTS建模
构建精密的TTS模型,侧重于自然度、韵律控制和声音克隆。
神经声码器
实现并评估现代神经声码器,用于高保真语音合成。
模型优化与部署
应用技术优化ASR/TTS模型,以提高速度、减小体积并实现高效部署。
评估方法
运用高级指标和方法评估ASR和TTS系统的性能。
本课程没有先修课程。
目前没有推荐的后续课程。
登录以撰写评论
分享您的反馈以帮助其他学习者。