Wenig Würze in der Kürze

Die Länge eines Wortes hängt von seinem Informationsgehalt ab: Lange Wörter transportieren viele Informationen, kurze eher weniger. Diesen Zusammenhang haben US-Forscher nachgewiesen, als sie Wörter aus 10 verschiedenen europäischen Sprachen von einem Computer analysieren ließen. Zwar erscheine diese Verbindung auf den ersten Blick recht logisch und naheliegend, tatsächlich stelle sie jedoch eines der grundlegenden Dogmen der Sprachforschung infrage, sagen die Wissenschaftler - und zwar die seit den 1930er Jahren geltende Theorie, dass die Wortlänge die Häufigkeit widerspiegelt, mit der das jeweilige Wort vorkommt. Demnach wären kurze Wörter vor allem deswegen kurz, weil sie extrem häufig benutzt werden. Die neue Analyse des Teams um Steven Piantadosi vom Massachusetts Institute of Technology (MIT) zeigt jedoch, dass der Informationsgehalt stärker mit der Länge eines Wortes korreliert als die Häufigkeit.
Die ursprüngliche Theorie stammt von dem US-Linguisten George Kingsley Zipf. Er war der Ansicht, dass das Verhältnis zwischen der Länge und der Häufigkeit des Gebrauchs eines Worts mit dem Bedürfnis zusammenhängt, den Aufwand beim Sprechen oder Schreiben so gering wie möglich zu halten. Die Forschung spricht dabei vom "principle of least effort", dem "Prinzip der geringsten Anstrengung". Piantadosi glaubt nach der Untersuchung von zehn europäischen Sprachen jedoch, dass das häufige Benutzen kurzer Wörter einen anderen Grund hat: Um eine bestimmte Menge an Informationen zu vermitteln, sei es effektiver, die am wenigsten aussagekräftigen Begriffe kurz zu halten - und nicht die am häufigsten verwendeten. Das bedeutet, dass der durchschnittliche Informationsgehalt eines Wortes ein weitaus besserer Indikator für seine Länge sein müsste als die Häufigkeit seines Gebrauchs.

Den Informationsgehalt eines Wortes zu bestimmen, ist allerdings schwierig, da er auch vom Kontext im Satz abhängt. Für ihre Analyse gingen die Forscher daher von der Annahme aus, dass ein Wort umso weniger Informationen transportiert, desto vorhersehbarer es ist. Ein Beispiel ist das Wort "stumm" in den beiden folgenden Sätzen: Bei "ein Männlein steht im Walde, ganz still und stumm" drängt es sich nach dem "und" nahezu auf, vermittelt jedoch keine Information, die nicht schon im Rest des Satzes enthalten gewesen wäre. Dagegen ist es bei "das Wort, das Du jetzt hören wirst, ist ?stumm?" absolut unverzichtbar - fehlt es, fehlt gleichzeitig eine Schlüsselinformation im Satz. Dieses Prinzip machten sich die Forscher zunutze, indem sie eine mathematische Formel für die Wahrscheinlichkeit entwickelten, mit der ein Wort mit anderen Wörtern verknüpft ist, und daraus den durchschnittlichen Informationsgehalt errechneten. Diese Formel wendeten sie auf tschechische, niederländische, englische, französische, deutsche, italienische, portugiesische, rumänische, spanische und schwedische Texte an.

Anhand des so berechneten Informationsgehaltes ließ sich die Wortlänge tatsächlich besser vorhersagen als auf Basis der Häufigkeit des Wortes, zeigte die Auswertung - auch wenn es sich um ein recht stark vereinfachtes Modell gehandelt habe, sagt Piantadosi. Er vermutet, dass das Verhältnis zwischen Wortlänge und Informationsgehalt nicht nur die Effizienz bei der Vermittlung von Inhalten steigert, sondern auch das Verständnis beim Leser oder Zuhörer verbessert: Wenn Informationsgehalt und Länge eines Wortes zusammenhängen, ist die Informationsdichte sehr gleichmäßig, das heißt, ein Sprecher vermittelt pro Zeiteinheit immer etwa gleich viele Informationen. Gäbe es diesen Zusammenhang nicht, würde es immer wieder zu einer Verdichtung im Informationsfluss kommen, bei der sehr schnell sehr viele Daten transportiert werden. Verpasst man diesen Moment oder versteht den Sprecher nicht richtig, verliert die Sprache an Effizienz.
Nature, Online-Dienst

Originalarbeit der Forscher: PNAS, Online-Vorabveröffentlichung, doi: 10.1073/pnas.1012551108

dapd/wissenschaft.de ? Hans Groth


Reload-Capcha neu laden Text der identifiziert werden soll

Bitte geben Sie zusätzlich noch den Sicherheitscode ein!

Rubriken

 


Harte Nuss
Rätsel: Berühmte Entdecker gesucht

 

Der Buchtipp

Eine kurzweilige Führung durch den Bienenstock mit einer erhellenden Dosis Wissenschaft – das bietet das Buch "Die Honigfabrik" von Jürgen Tautz.

Zu allen Buchtipps


Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der Konradin Mediengruppe