Sprachliche Variabilität des Deutschen und ihre Erfassung mit Methoden der automatischen Spracherkennung

  • Die Datenbank wird auf den Ergebnissen der Analyse einschlägiger umfangreicher Korpora des gesprochenen Deutsch basieren. Um jedoch große Korpora analysieren zu können, ist es notwendig, automatische Analyseverfahren der Variation zu entwickeln. Mit traditionellen manuellen Methoden kann der Aufbau einer korpusbasierten Datenbank kaum verwirklicht werden. Dem eigentlichen Variationsprojekt wurde daher eine kleine Pilotstudie vorgeschaltet, die die Möglichkeiten der automatischen Analyse prüfen sollte. Dabei wurde der Frage nachgegangen, ob es möglich ist, regionale Varianten des Deutschen mit Verfahren der automatischen Spracherkennung zu untersuchen, d.h., ob es möglich ist, eine verlässliche Transkription der regionalen Varianten automatisch herzustellen. Diese Pilotstudie zur automatischen Transkription stützte sich auf das im IDS bereits vorhandene System SPRAT (Speech Recognition and Alignment Tool), das zum Alignieren (Text-Ton-Synchronisation) verwendet wird. Im Rahmen der Pilotstudie wurde dieses System modifiziert und in einer Reihe von Tests dessen automatische Transkription evaluiert (vgl. Abschnitt 3). Das Ziel des vorliegenden Beitrags ist es, die Ergebnisse dieser Pilotstudie vorzustellen. Zunächst aber soll ein kurzer Exkurs verdeutlichen, um welches System es sich beim IDS-Aligner SPRAT handelt.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Nina BerendGND, Stefan KleinerGND, Ralf KnöblGND
URN:urn:nbn:de:hebis:30-1127171
Parent Title (German):OPAL - Online publizierte Arbeiten zur Linguistik ; 2005,0
Publisher:Institut für Deutsche Sprache
Place of publication:Mannheim
Document Type:Book
Language:German
Date of Publication (online):2009/04/28
Year of first Publication:2005
Publishing Institution:Universitätsbibliothek Johann Christian Senckenberg
Creating Corporation:Institut für Deutsche Sprache <Mannheim>
Release Date:2009/04/28
Source:Nina Berend / Stefan Kleiner / Ralf Knöbl: Sprachliche Variabilität des Deutschen und ihre Erfassung mit Methoden der automatischen Spracherkennung - Mannheim, 2005
HeBIS-PPN:215970284
Dewey Decimal Classification:4 Sprache / 40 Sprache / 400 Sprache
Sammlungen:Linguistik
Licence (German):License LogoDeutsches Urheberrecht