Dieses Gesetz scheint auch für andere englische Texte zu gelten, es sagt aber nichts über die Bedeutung eines Wortes aus. So liegt beispielsweise das Wort „or“ auf Platz 45 in der Rangfolge und schon auf Platz 47 folgt das Wort „Hamlet“. Sicherlich kommt das Wort „or“ in allen von Shakespeare geschriebenen Schauspielen vor – „Hamlet“ dagegen aber nur in einem. Einige Worte sind daher von genereller Bedeutung für alle Texte. Andere sind, selbst wenn sie in einem Text relativ häufig vorkommen, nur für diesen speziellen Text von Bedeutung.
Die argentinischen Physiker Marcelo Montemurro von der National University of Cordoba und Damian Zanette vom Centre for Atomic Science in Bariloche entwickelten jetzt ein neues Strukturmodell der englischen Sprache. Um die Bedeutung eines Wortes in die statistische Auswertung einzubinden teilten sie jedem Wort einen Faktor, die „Shannon Entropie“, zu. Sie gibt an ob ein Wort von genereller Bedeutung für alle Texte ist. Ihr Modell testeten sie an allen von Shakespeare geschriebenen Stücken. Dabei stellten sie fest, dass sie allein durch die Verteilung der Wörter in einem Text darauf schliessen können ob es sich um ein Verb oder ein Nomen handelt.