Speech Recognition Enhanced by Visual Cues (Introduction)

Was this section helpful?

References

Hearing lips and seeing voices, HARRY MCGURK, JOHN MACDONALD, 1976 Nature, Vol. 264 (Springer Nature) DOI: 10.1038/264746a0 - Original paper describing the McGurk effect, demonstrating human speech perception's integration of auditory and visual information.
A Survey of Audio-Visual Speech Recognition with Deep Learning, Ziliang Chen, Rui Ma, Haofei Su, Junjie Wang, Jing Han, Lingxiao Wang, 2022 Sensors, Vol. 22 (MDPI) DOI: 10.3390/s22020614 - Presents a review of recent advancements in audio-visual speech recognition using deep learning techniques.