Was ist audiovisuelle Spracherkennung
Audiovisuelle Spracherkennung (AVSR) ist eine Technik, die Bildverarbeitungsfunktionen beim Lippenlesen nutzt, um Spracherkennungssysteme bei der Erkennung undeterministischer Laute zu unterstützen oder Vorrang bei nahezu wahrscheinlichen Entscheidungen geben.
Wie Sie davon profitieren
(I) Einblicke und Validierungen zu den folgenden Themen:
Kapitel 1: Audiovisuelle Spracherkennung
Kapitel 2: Datenkomprimierung
Kapitel 3: Spracherkennung
Kapitel 4: Sprachsynthese
Kapitel 5: Affektives Rechnen
Kapitel 6: Spektrogramm
Kapitel 7: Lippenlesen
Kapitel 8: Gesichtserkennung
Kapitel 9: Funktion (maschinelles Lernen)
Kapitel 10: Statistische Klassifizierung
(II) Beantwortung der häufigsten öffentlichen Fragen zur audiovisuellen Spracherkennung.
(III ) Beispiele aus der Praxis für den Einsatz audiovisueller Spracherkennung in vielen Bereichen.
An wen sich dieses Buch richtet
Profis, Studenten und Doktoranden, Enthusiasten , Hobbyisten und diejenigen, die über grundlegende Kenntnisse oder Informationen für jede Art von audiovisueller Spracherkennung hinausgehen möchten.