Skip to Main Content

German Dialects: Document, Preserve and Learn (with the help of AI)

Project Description

Das Projekt wird in Zusammenarbeit mit der Ludwig-Maximilians-Universität München, dem Österreichischen Forschungsinstitut für Artificial Intelligence und der Universität Liechtenstein durchgeführt. Ziel ist es, die Dialekte von Liechtenstein, Westösterreich und Südtirol zu dokumentieren und zu erforschen.
Das Projekt teilt sich in drei Phasen:
Phase 1: Dokumentation und Archivierung: Sammlung von Audioaufnahmen in Dialekten aus öffentlichen Quellen angereichert mit eigens für das Projekt erstellten Audio-Aufnahmen.
Phase 2: Maschinelle Verarbeitung der Audiosammlung: Die gesammelten Audiodateien werden automatisch nach Hochdeutsch transkribiert und Metadaten werden erstellt: Geschlecht des Sprechers, zugehörige Dialektregion und Altersgruppe.
Phase 3: Lernen: Die verwendeten AI-Modelle werden auf einer Plattform Interessenten angeboten. Es werden Anleitungen für Linguisten und AI-Forscher erstellt, wie diese Modelle bei ihrer Forschungsarbeit eingebunden werden können. Weitere Funktion der Plattform ist die Unterstützung bei der Erlernung von Dialekten. Damit hilft die Plattform die sprachliche Barriere für zugezogene Personen zu überwinden.