1. Zum Inhalt springen
  2. Zur Hauptnavigation springen
  3. Zu weiteren Angeboten der DW springen

Das "Hausbuch für alle"

Nils Schiffhauer20. November 2002

Wieviele Wörter hat die deutsche Sprache? Wo kommen sie her? Was bedeuten sie? Antworten darauf gibt seit 150 Jahren "Das Deutsche Wörterbuch". Jetzt gibt es die 32 Bände geballten Wissens benutzerfreundlich auf CD-ROM.

https://p.dw.com/p/2qV8
Jacob und Wilhelm Grimm bearbeiteten das Wörterbuch bis zum Artikel <i>Frucht</i>

"Der Grimm" ist eine Institution - mit seinen 331.056 Einträgen dokumentiert das Wörterbuch den Gesamtbestand des deutschen Wortschatzes. Eine derart umfassende Bestandsaufnahme kennt sonst nur noch das Englische mit seinem Oxford English Dictionary OED. Noch dazu ist im "Grimm" der deutsche Wortschatz ausführlich mit Zitaten, vor allem aus der Literatur, belegt. Alle drei Monate wird der Wortbestand aktualisiert.

Deutsch-chinesisches Gemeinschaftsprojekt

Die digitale Ausgabe entstand mit einem Aufwand von einer Million Euro innerhalb von zwei Jahren an der Universität Trier. Wie die etwa 300 Millionen Zeichen auf die Scheibe fanden, erläutert Dr. Thomas Burch, der in Trier das "Kompetenzzentrum für elektronische Erschließung und Publikationsverfahren in den Geisteswissenschaften" leitet: "Wir gehen von der Textvorlage des Wörterbuches aus und arbeiten mit einem Erfassungsbüro in China zusammen, an welches wir die Texte übermitteln. Dort arbeiten dann zwei Gruppen von Eingebern unabhängig voneinander in einem Team A und B und erfassen parallel jeweils das Wörterbuch manuell am Computer."

Auf diese Weise entstehen zwei digitale Fassungen ein und des selben Textes, die dann abgeglichen werden. Am Ende bleiben nur noch drei Fehler auf zehn Seiten. Die Eingabe erfolgt Zeile für Zeile. Und zwar so, dass Typographie und Layout des Originals erhalten bleiben. Die Chinesen hätten eine besondere Sensibilität für Zeichen entwickelt, erläutert Dr. Jingning Tao, der für die Kooperation mit der Arbeitsgruppe in Nanjing zuständig ist: "Das hat mit der chinesischen Schrift zu tun, die die Chinesen von Kind an lernen. Außerdem lernen sie schon in der Grundschule die lateinischen Buchstaben."

"Steinbruch der Wörter"

Die Gebrüder Grimm - die "Ur-Verfasser" des Wörterbuchs - sind in China keine Unbekannten. Ihre Märchen kennt dort beinahe jedes Kind. Dass "der Grimm" im Reich der Mitte digitalisiert wird und damit tatsächlich zum preiswerten "Hausbuch" werden könnte, klingt wie eine Anekdote aus der langen Geschichte des Werkes. 1868 wurde es begründet, um den Brüdern bald über den Kopf zu wachsen. Erst 1961 und somit fast 100 Jahre später erschien der letzte Band. Erfasst wird der neuhochdeutsche Wortschatz ab 1450 bis zur Gegenwart.

Diesen "Steinbruch der Wörter" zu erschließen, ist für Dr. Jingning Tao nicht nur stures Abtippen, sondern bietet neben Arbeit auch einen willkommenen Wissenstransfer: "Auf dem Land gibt es wenig Möglichkeiten, Arbeit zu finden. Da haben wir viele Leute speziell für diesen Zweck ausgebildet. Sie haben gelernt, wie man überhaupt mit dem Computer umgeht. Und dann müssen sie auch üben, schnell zu tippen." Es dauert meistens zwei, drei Monate, bis die "Tipper" voll einsatzfähig sind. Denn es gibt auch noch eine Codierungskonvention zu lernen, dazu diverse Sonderzeichen und das griechische Alphabet - denn auch das kommt im "Grimm" vor.

Wörterbuch im Internet

Nach der Digitalisierung wurden die Daten in einer Datenbank erfasst. Nur damit lässt sich das Werk mit wissenschaftlichen Fragestellungen - wie viele Zitate gibt's von Hitler, wie viele von Frauen? - erforschen. Dabei werden die einzelnen Teile des Wörterbuches unterschiedlich markiert. Für diesen Arbeitsgang ist in Trier der "datenverarbeitende Philologe" Hans-Werner Bartz zuständig. Er hatte einige Kopfnüsse zu knacken, denn zum Beispiel nicht immer wird Gleiches auch gleich geschrieben: "Das prominenteste Beispiel ist Goethe, den finden wir mit OE, wie wir ihn heute schreiben, aber auch mit Ö. Aufsehenerregender wäre beispielsweise der Name Abraham a Sancta Clara. Den gibt es in 30 Varianten", erläutert er. Das Mammutprojekt "Deutsches Wörterbuch" ist inzwischen auf CD-ROM gebrannt. Ab Februar 2004 soll es im Handel sein. Die sogenannte "Beta-Version" - eine CD-ROM, die sechs Monate lang zum Testen läuft - kann ab Herbst 2002 zu einem Unkostenbeitrag von 25 Euro an interessierte Benutzer verschickt werden. Vorab lässt sich das Wörterbuch auch im Internet besichtigen.