Saarbrücker Forscher bringen Wörterbücher automatisch auf aktuellsten Stand

Der Saar-Uni-Germanist Prof. Lutz Götze hatte in detaillierter „Handarbeit“ das Bertelsmann Rechtschreibwörterbuch nach der Rechtschreibreform als Autor maßgeblich verfasst.

Nun schreibt ein weiterer Saarbrücker Wissenschaftler „Wörterbuch-Geschichte“: Der Computerlinguist und Leibniz-Preisträger Prof. Manfred Pinkal entwickelt mit seiner Firma CLT Sprachtechnologie richtungsweisende Verfahren, die vollautomatisch neue Wörter und neue Wortbedeutungen identifizieren. Ergebnisse dieser Forschung finden sich in der soeben erschienenen Neuauflage des Wörterbuchs „Wahrig. Die deutsche Rechtschreibung“ des Bertelsmann Lexikon Verlages.

Immer schnellere Entwicklungen in allen Lebensbereichen und der rasante technische Fortschritt verändern unseren Sprachgebrauch nachhaltig. Wörter wie „simsen“, „Ceranfeld“ oder „Beamer“, „NEMAX“ und „risikofreudig“ sind längst Bestandteil unserer Alltagssprache. Um am Puls der Zeit zu bleiben, müssen Wörterbücher also regelmäßig überarbeitet werden.
Wie aber findet man die neuen Wortschöpfungen und neuen Wortbedeutungen?
In Saarbrücken werden auf diesem Gebiet Maßstäbe gesetzt: So bereits seit Jahren durch den Saarbrücker Germanist und Wörterbuch-Autor Prof. Lutz Götze – auch in der Neuauflage des Bertelsmann Rechtschreibwörterbuches vor drei Jahren trug er entscheidend dazu bei, dass neben der neuen Rechtschreibung auch die neuesten Wörter dargestellt werden konnten.
Nun beschreitet Professor Manfred Pinkal mit dem Forscherteam der von ihm gegründeten Firma CLT Sprachtechnologie im Rahmen einer Kooperation mit dem Bertelsmann Lexikon Verlag neue Wege auf dem Gebiet des Wörterbuches: mit einem neuen computerlinguistischen Verfahren, dem WAHRIG Textkorpus digital. Diese rund 500 Millionen Wörter umfassende Datenbank brachte jetzt das neue Bertelsmann Wörterbuch „Wahrig. Die deutsche Rechtschreibung“ auf aktuellsten Stand – und zwar vollautomatisch.
Quelle der neuen Wörter und Bedeutungsvarianten sind Zeitungen und Zeitschriften des deutschsprachigen Raums. Mittels computerlinguistischer Werkzeuge und Verfahren werden die Texte und Wörter aufbereitet und analysiert – von den bislang erfassten 500 Millionen Textwörtern und Wortformen stehen viereinhalb Millionen nicht im Wörterbuch. Das System untersucht diese Wörter syntaktisch daraufhin, ob sie Artikel, Adjektiv oder Verb sind und identifiziert die Wortstämme. Unterschiedliche Filtermethoden scheiden Namen und Rechtschreibfehler aus, die verbleibenden Wörter werden nach Häufigkeit und Vorkommens-Mustern sortiert.
5000 interessante neue Wörter wurden so für die neueste Auflage des „Wahrig. Die deutsche Rechtschreibung“ ausfindig gemacht.
Mit Hilfe von „Wortfrequenzlisten“ wurde dann entschieden, welche Wörter letztendlich als Neueinträge das Rennen machen: Für jedes Wort wurde – natürlich ebenfalls vollautomatisch – eine repräsentative Liste von Belegen erstellt; 20 davon erhielt die Redaktion des Bertelsmann Lexikon Verlages pro Wort. 1100 neue Wörter nahm sie in die aktuelle Neuauflage auf.

Der gesamte Weg – von der Konzeption und Realisierung des Korpus über die Entwicklung von Filter- und Auswahlverfahren bis zur Endredaktion des Wörterbuchs – wurde in der kurzen Zeit von einem Jahr zurückgelegt.
Nächste Etappe der Kooperation ist die vollständige Neu-Bearbeitung des Großen Wahrig, der auch Bedeutungserklärungen und Anwendungsbeispiele gibt.

Sie haben Fragen? Dann setzen Sie sich bitte in Verbindung mit Prof. Manfred Pinkal E-mail: pinkal@coli.uni-sb.de oder Dr. Bettina Klingner Email: klingner@clt-st.de
Tel: 0681-302 3823 Fax: 0681-302 6632

Media Contact

Claudia Brettar idw

Alle Nachrichten aus der Kategorie: Interdisziplinäre Forschung

Aktuelle Meldungen und Entwicklungen aus fächer- und disziplinenübergreifender Forschung.

Der innovations-report bietet Ihnen hierzu interessante Berichte und Artikel, unter anderem zu den Teilbereichen: Mikrosystemforschung, Emotionsforschung, Zukunftsforschung und Stratosphärenforschung.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Ideen für die Zukunft

TU Berlin präsentiert sich vom 22. bis 26. April 2024 mit neun Projekten auf der Hannover Messe 2024. Die HANNOVER MESSE gilt als die Weltleitmesse der Industrie. Ihr diesjähriger Schwerpunkt…

Peptide auf interstellarem Eis

Dass einfache Peptide auf kosmischen Staubkörnern entstehen können, wurde vom Forschungsteam um Dr. Serge Krasnokutski vom Astrophysikalischen Labor des Max-Planck-Instituts für Astronomie an der Universität Jena bereits gezeigt. Bisher ging…

Wasserstoff-Produktion in der heimischen Garage

Forschungsteam der Frankfurt UAS entwickelt Prototyp für Privathaushalte: Förderzusage vom Land Hessen für 2. Projektphase. Wasserstoff als Energieträger der Zukunft ist nicht frei verfügbar, sondern muss aufwendig hergestellt werden. Das…

Partner & Förderer