Quellentrennung und Störreduktion für die automatische Spracherkennung in dynamischen akustischen Szenarien

Project Period: 2016-08-01 – 2021-12-31
Externally Funded
Alternative Name
Source separation and interference reduction for automatic speech recognition in dynamic acoustic environments (Transfer Project)
Coordinator
Reinhold Häb-Umbach
Principal Investigator
Reinhold Häb-Umbach
Department(s)
Nachrichtentechnik (NT) / Heinz Nixdorf Institut
Description

In diesem Projekt soll die Robustheit eines Spracherkennungssystems für Sprachbedienung im Freisprechmodus mit Anwendungen im Smart Home Bereich verbessert werden. Aufbauend auf den Ergebnissen aus dem DFG-Vorgängerprojekt sollen die dort entwickelten mehrkanaligen Quellentrennungs- und Störreduktionsverfahren unter realistischen Randbedingungen hinsichtlich Störszenarien, erlaubter Latenz der Verarbeitung und Realisierbarkeit auf eingebetteten Systemen weiterentwickelt werden. Es soll ein Prototyp entwickelt werden, der unter praktischen raumakustischen Umgebungsbedingungen und typischen Anwendungsszenarien in Echtzeit mit geringer Latenz lauffähig ist und ein bereits beim Anwendungspartner existierendes Spracherkennungssystem in der erreichbaren Erkennungsrate schlägt. Als Alternative zu dem parametrischen Quellentrennungs- und Störreduktionsverfahren soll weiterhin ein Signalverbesserungsverfahren basierend auf einem neuronalen Netzwerk entwickelt werden und die Vor- und Nachteile der jeweiligen Verfahren in realistischen Anwendungsszenarien hinsichtlich erreichbarer Signalqualität, Latenz, Rechen- und Speicherressourcenbedarf, sowie Robustheit gegenüber variierenden akustischen Umgebungsbedingungen herausgearbeitet werden.


DFG-Verfahren Sachbeihilfen (Transferprojekt)


Anwendungspartner voice INTER connect GmbH

Grant Number
Funding Organisation
Deutsche Forschungsgemeinschaft
Cooperator
voice INTER connect GmbH