Der König des Daten-Dschungels

Ein tschechischer Forscher hat eine Technologie entwickelt, mit der sich Bildmotive, Filme und Musik im Internet schnell und zuverlässig aufspüren und analysieren lassen.

Ein Mann bewegt sich unauffällig im Supermarkt. Er scheint einkaufen zu wollen. Doch in einem unbeobachteten Moment nimmt er aus dem Regal eine Flasche mit teurem Wein und versteckt sie unter seiner Jacke. Mit seiner verborgenen Beute geht der Ladendieb an der Kasse vorbei und macht sich rasch aus dem Staub. Der Räuber glaubt, den gestohlenen edlen Tropfen straflos genießen zu können. Was er nicht ahnt: Als er an der Kasse vorbeiging, wurde er von einem neuartigen System aus drei Kameras gefilmt. Und das wird ihm zum Verhängnis. Denn das System ist mit einer speziellen Software für biometrische Merkmalsbestimmung verbunden, die Personen anhand bestimmter körperlicher Charakteristiken erkennen kann. Hier heißt das: Der Gang des Diebs wird genau analysiert. Das ermöglicht es, aus den Kameraaufnahmen ein dreidimensionales Modell der Bewegungen beim Gehen zu extrahieren. Dieses Modell wird dann mit anderen Aufnahmen verglichen, die in einer Datenbank gespeichert sind. Schon nach wenigen Stunden stehen der Polizei die Ergebnisse zur Verfügung. Im Fall des Ladendiebstahls kann das findige System den Dieb identifizieren: Es ist ein alter Bekannter der Beamten, der den Supermarkt nicht zum ersten Mal bestohlen hat.

Gang und gesicht unter der Lupe

Dieses biometrische Identifikationssystem ist nur eines von mehreren Projekten, mit denen sich ein Forscherteam um Pavel Zezula, Professor an der Fakultät für Informatik der Masaryk-Universität im tschechischen Brno (Brünn), beschäftigt. Das achtköpfige Team forscht an der sogenannter Affinitätserkennung in Multimedia-Daten, das heißt in Bildern, Videos oder Tonaufnahmen. Mit diesem Verfahren lassen sich auch Gesichter oder Fingerabdrücke vergleichen.

„Vor 20 Jahren war die Sache noch einfach", meint Pavel Zezula: „Die Daten lagen meist in Form von Zahlen oder Zahlenketten vor, die sich problemlos mit sogenannten Relationsdatenbanken durchsuchen ließen." Als jedoch in den 1990er-Jahren das World Wide Web entwickelt und immer intensiver genutzt wurde, explodierte die Menge an multimedialen Daten geradezu. Allein auf dem sozialen Netzwerk Facebook werden heute täglich rund 250 Millionen Bilder hochgeladen, und die Video-Website YouTube wächst pro Minute um etwa 60 Stunden Videomaterial. Mithilfe klassischer Suchverfahren, wie sie etwa die Web-Suchmaschine Google verwendet, wären diese Daten nicht aufzuspüren.

Fahnden wie das Gehirn

Solche Suchmaschinen finden Bilder vor allem über Textbeschreibungen. Viele Internet-Nutzer, die ihre Fotos ins Web stellen, liefern solche Beschreibungen aber nur unvollständig oder gar nicht. Sie nummerieren die Bilder oft nur durch und nennen sie zum Beispiel „Urlaub001" und so weiter. Die Brünner Informatiker um Zezula wollen nun ein neues Verfahren für die Mustererkennung in Multimedia-Daten entwickeln, das ähnlich arbeitet wie das menschliche Gehirn. Es vergleicht die in einem Bild enthaltenen Formen, Farben und Texturen und erstellt daraus rasch eine Liste der Bilder, deren Inhalt sich ähnelt.

Das gelingt mit dem Affinitätsprinzip: Auf Basis der extrahierten Eigenschaften ermittelt das Programm für jedes Bild einen Punkt in einem imaginären mehrdimensionalen Raum und vergleicht seine Distanz zu anderen Punkten in diesem Raum. Je näher sich zwei Punkte sind, desto ähnlicher sind die beiden zugehörigen Bilder. Durch diesen Vergleich abstrakter mathematischer Beschreibungen lässt sich das Problem der unvollständigen Textbeschreibungen umgehen – und die Suche nach einem Foto führt schnell zum Ergebnis.

Mufin sucht Hund

Pavel Zezula und sein Team haben auf der Basis dieser Technologie das System „Mufin" (Multi-feature Indexing Network) geschaffen und als Demo-Anwendung ins Internet gestellt, die jeder kostenlos testen kann. Mufin basiert auf einer Sammlung von rund 100 Millionen Bildern aus der Foto-Website Flickr. Gibt man dem System etwa ein Bild mit einem Hund als Muster vor, dann erkennt ein mathematischer Algorithmus zuerst die Formen, Farben und Texturen in dem Hundebild, dann beginnt er mit der Suche nach ähnlichen Fotos. Sekundenschnell erscheinen als Resultat Dutzende Bilder, die dem Musterbild ähneln: Fotos von Hunden verschiedener Rasse und Größe.

Zu den größten Vorteilen von Mufin gehört seine Vielseitigkeit: Das System lässt sich zur Suche nach beliebigen multimedialen Daten verwenden – nach Fotos, Filmen, Sprache und Musik. Die Technologie kommt auch mit einer schnell wachsenden Zahl von Bildern oder Audiodateien in der Datenbank mühelos klar. Zurzeit verwenden die Bilddatenbanken Pixmac und Profimedia probeweise das neue System.

„Eine besonders hilfreiche Anwendung ist die Analyse von Diagrammen und Zeitreihen", sagt David Novák, Mitglied des Forscherteams in Brno. „Das nutzen Währungs- und Aktienhändler an der Börse: Sie können damit in der Preisentwicklung bestimmte Muster aufspüren, die ihnen Hinweise auf eine mögliche künftige Entwicklung liefern." Auch beim Online-Einkauf hilft die Affinitätserkennung – wenn man nach Schuhen, Brillen oder Kleidern sucht, die einem bestimmten Produkt ähneln. Ärzten erleichtert das Verfahren die Suche nach Röntgen- oder MRT-Aufnahmen und unterstützt die Diagnose von Erkrankungen. Und die Polizei kann damit im Internet kinderpornografische Bilder aufspüren. Die Polizei ist noch aus einem anderen Grund an der Affinitätserkennung interessiert: Sie hilft bei der Analyse von Telefongesprächen. Denn die Technologie kann einzelne Stimmen in vielen gleichzeitig geführten Telefonaten identifizieren. ■

MICHAL CERNY arbeitet als Technik- und Wissenschaftsjournalist in Prag, unter anderem für ein deutsches Computermagazin.

von Michal Cerny

Affinitätserkennung im Test

Wer will, kann das Verfahren selbst ausprobieren. Im Internet gibt es mehrere Anwendungen:

Mufin

Suche von ähnlichen Bildern: mufin.fi.muni.cz/imgsearch/similar

Suche in Zeitreihen:

mufin.fi.muni.cz/subseq

Automatisches Ergänzen von Bildern durch passende Textbeschreibungen, die an ähnliche Bilder angelehnt sind: mufin.fi.muni.cz/annotation

TinEye

Eine Dienstleistung der Firma Idée aus Toronto. Die Suche von ähnlichen Bildern lässt sich zum Beispiel von Copyright-Inhabern nutzen, um Bilder im Internet zu finden, die ihre Autorenrechte verletzen. www.tineye.com

ALIPR

Ein halbautomatisches Annotationssystem mit inhaltlicher Suche. Gibt man in das System ein Foto ein, bietet das Tool Textmerkmale an, die sich dem Foto hinzufügen lassen. Man kann auch eigene Merkmale ergänzen, sodass das System „dazulernt". Der Mangel an Textmerkmalen bei Bildern stellt eines der größten Probleme der multimedialen Datenflut dar. alipr.com

VizSeek

Ein Projekt, das auf der Suche mittels Formaffinität beruht. Es ist spezialisiert auf die Suche nach ähnlichen Bauteilen im Maschinenbau. www.vizseek.com

Pixolu

Prototyp einer Applikation, die mit Inhaltserkennung arbeitet. Das Prinzip: Der Nutzer gibt ein Wort ein, zum Beispiel „Gitarre" , und bekommt als Ergebnis eine Sammlung von 100 Bildern aus Flickr, Yahoo und Google. www.pixolu.de

Bilder und Töne im Visier

Der Informatiker Pavel Zezula forscht an der Universität Brno (Brünn) seit den 1990er-Jahren an Methoden, um Multimedia-Daten zu erkennen und aufzuspüren. Ziel ist die vereinfachte Suche in Bild- und Audiodatenbanken.

Reload-Capcha neu laden Text der identifiziert werden soll

Bitte geben Sie zusätzlich noch den Sicherheitscode ein!

Rubriken

 


Harte Nuss
Rätsel: Berühmte Entdecker gesucht

 

Der Buchtipp

Der italienische Ökologe und Insektenforscher Gianumberto Accinelli erklärt Dominoeffekte in der Natur kindgerecht und mit einer Prise Humor. Sein Sachbuch ist Wissensbuch des Jahres 2017 in der Kategorie Perspektive.

Zu allen Buchtipps


Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der Konradin Mediengruppe