Ein systematischer Ansatz zur Ausnutzung von Korrelationen aufeinander folgender Merkmalsvektoren in der automatischen Spracherkennung

Project Period: 2008-01-01 – 2011-12-31
Externally Funded
Coordinator
Reinhold Häb-Umbach
Principal Investigator
Reinhold Häb-Umbach
Department(s)
Nachrichtentechnik (NT) / Heinz Nixdorf Institut
Description

Bekannte Schwachstellen heutiger automatischer Spracherkennungssysteme sind die mangelnde Robustheit gegenüber gestörten (z.B. verrauschten) Eingangssignalen, „Interframe-ASR“ 2 sowie die unzulängliche Modellierung einer Merkmalsvektortrajektorie aufgrund der üblichen conditional independence Annahme, die besagt, dass die Wahrscheinlichkeit für einen Merkmalsvektor lediglich vom Hidden Markov Modellzustand abhängt. Ausgehend von einer Erweiterung der Herleitung des Spracherkenners aus der Bayes’schen Entscheidungsregel, welche das Vorhandensein von gestörten Merkmalsvektoren und Korrelationen aufeinander Sprachrahmen explizit berücksichtigt, wurden zunächst Methoden der geräuschrobusten Erkennung untersucht. Die Korrelationen aufeinander folgender Merkmalsvektoren wurden dabei mit schaltenden dynamischen Modellen erfasst. Der Schwerpunkt der Arbeiten im zweiten Projektabschnitt ist die Entwicklung hybrider Erkennerstrukturen, die die Vorteile der Modellierung mit dynamischen Modellen einerseits und hidden Markov Modellen andererseits vereinen sollen, um zu einer insgesamt höheren Erkennungsrate zu gelangen.


DFG-Verfahren Sachbeihilfen

Grant Number
Funding Organisation
Deutsche Forschungsgemeinschaft