Italienische Forscher haben ein Computerprogramm entwickelt, das den Autor eines Textes erkennen kann. Das Programm unterscheidet sicher Dante von Machiavelli oder Pirandello, indem es im Text die Menge an wiederkehrenden Buchstabenfolgen analysiert, berichtet Dario Benedetto von der Universität “La Sapienza” zusammen mit Kollegen im Magazin “Physical Review Letters” (Bd. 88).
Eine wiederkehrende Zeichenfolge könnte etwa “der dunkle Wald” sein. Das Programm markiert die Buchstabenfolgen und zählt sie durch. Die Aufgabe erledigt ein ähnlicher Computeralgorithmus, wie er auch zum komprimieren von Daten benutzt wird: Bei der Kompression werden wiederkehrende Zeichenfolgen, durch ein Kürzel ersetzt. Je mehr wiederkehrende Zeichen das Programm entdeckt, um so stärker ist die Kompression. Auf eine ähnlich Weise komprimiert auch das Programm von Benedetto und seinen Kollegen einen Text. Der dabei erreichte Komprimierungsgrad ist dabei für jeden Schreiber typisch und verrät so den Autor eines Textes.
Andreas Wawrzinek
Teilen: