Mit raffinierter Computertechnik können Informatiker der TU Dortmund nun den Inhalt von komplizierten Handschriften schnell und automatisch durchsuchen. Durch das Verfahren des sogenannten „Deep Learnings” erlernt der Rechner selbstständig bestimmte Schlüsselwörter in Texten und findet diese dann an anderen Stellen wieder. So lassen sich schwer zu entziffernde Handschriften verschiedener Sprachen schnell und effektiv auswerten.
Bisher war es ausgesprochen mühsam: Entziffern war angesagt, wenn Historiker beispielsweise herausfinden wollten, welche Informationen in einer umfangreichen Handschrift in Latein, Arabisch oder Kurrent-Schreibschrift stecken. Die Informatiker um Gernot Fink von der TU Dortmund können dabei nun helfen. Übersetzen können sie die Texte nicht, mit ihrem System können sie aber bestimmte Schlüsselwörter in den Texten automatisch ausfindig machen.
Möglich wird dies durch das Computerverfahren des Deep Learnings beziehungsweise des „Word Spottings”. Auf Abbildungen der Texte erkennt der Rechner dabei zunächst Wörter und zerlegt das Wortbild in einer Vielzahl von Rechenschritten in kleine Informationshäppchen. Dann speichert er die Wortbild-Informationen als Datei ab – er lernt. Anschließend lässt er seinen „geschulten Blick” über den ganzen Text wandern und erkennt die erlernten Wörter. Wie bei einer Google-Suche kann der Rechner dann die Ergebnisse seiner Auswertung anzeigen.
Computertechnik für Historiker
Auf diese Weise lässt sich eine große Zahl von Dokumenten auf bestimmte Schlüsselwörter untersuchen. So können unter anderem alte Handschriften mit großem Umfang schnell gesichtet werden, berichtet die TU Dortmund. Ein Beispiel ist die Suche nach Wetterinformationen in historischen Aufzeichnungen: Der Hochleistungs-Rechner „lernt” dazu etwa das Schriftbild für den Begriff „Temperatur”. Anschließend kann er in den Dokumenten alle Stellen ausfindig machen, an denen dieser Begriff auftaucht und an denen somit eine wichtige Information im Text stecken könnte.
Voraussetzung für die Fähigkeit zum Deep Learning an der TU Dortmund war die Anschaffung eines hochmodernen Computersystems. „Wir profitieren von den Herstellern von Spielekonsolen”, sagt Fink. „Die haben immer leistungsfähigere Grafikkarten gebaut, um Spielszenen auf dem Bildschirm möglichst realitätsgetreu abbilden zu können.” Diese Hochleistungs-Grafikkarten werden nun zum „Training” von Neuronalen Netzen verwendet, die das Herzstück des Deep Learnings bilden, erklären die Informatiker.
Die Informatiker arbeiten nun mit Altphilologen der Universität Würzburg zusammen, um alte Schriften zu analysieren. Man darf also gespannt sein, was die Kombination von Computertechnologie mit historischer Forschung hervorbringen wird.