Ein Roboterarm spielt Jenga - wissenschaft.de
Anzeige
Anzeige

Technik+Digitales

Ein Roboterarm spielt Jenga

Roboter beim Jenga
Dieser Roboterarm hat gelernt, Jenga zu spielen. (Bild: Fazeli et al., Sci. Robot. 4, eaav3123 (2019))

In einem Keller des Massachusetts Institute of Technology (MIT) in den USA spielt ein Roboter mit Bauklötzen – und soll damit die Roboterforschung voranbringen. Denn der Roboterarm lernt ein für seinesgleichen anspruchsvolles Spiel: Jenga. Damit die aus Klötzchen bestehende Turmkonstruktion nicht einstürzt, darf der Roboter nur ganz bestimmte Klötze entfernen. Das Spannende daran: Um diese Aufgabe zu lösen, muss der Roboter visuelle und taktile Reize gleichermaßen verarbeiten – nur dann versteht er, welche Aktionen Erfolg bringen. Die Fähigkeit, selbstständig auf Basis solcher multisensorischen Informationen und der eigenen Handlungen zu lernen, könnte künftige Roboter anpassungsfähiger und flexibler machen.

Im Spiel „Jenga“ besteht die Aufgabe darin, einen Turm aus 54 rechteckigen Holzklötzchen nach und nach höher zu bauen. Der Clou dabei: Jeder Baustein muss erst aus einer der unteren Turmstockwerke vorsichtig herausgelöst werden, ohne den Turm kippen zu lassen. „Anders als bei rein kognitiven Aufgaben oder Spielen wie Schach oder Go erfordert das Spiel Jenga auch die Beherrschung physischer Fertigkeiten wie dem Schieben, Testen, Platzieren und Ausrichten von Spielsteinen“, erklärt Seniorautor Alberto Rodriguez vom Massachusetts Institute of Technology (MIT). „Man benötigt dafür interaktives Wahrnehmen und Handeln, weil man durch vorsichtiges Berühren des Turms lernen muss, wo und wie man am besten einen Bauklotz bewegt.“

Lernen durch Generalisierung

Wollte man einem Roboter dieses Spiel mithilfe der traditionellen Verfahren des Maschinenlernens beibringen, müssten die Algorithmen alles Erfassen und Durchtesten, was zwischen einem Bauklotz, dem Turm und dem Roboter stattfindet. Der Roboterarm müsste dafür tausende, vielleicht sogar zehntausende von Spielzügen ausführen – und die Forscher müssten den Turm fast ebenso oft wieder aufbauen. Um diesen enormen Aufwand zu umgehen, haben Rodriguez, sein Kollege Nima Fazeli und ihr Team nach effizienteren Lernstrategien für ihren Roboter gesucht. Ihr Ansatz: Ähnlich wie es der Mensch tut, sollte das Maschinengehirn des Roboters lernen, auf Basis nur weniger Versuche verallgemeinerte Vermutungen über das Verhalten der Klötze und des Turms zu entwickeln. „Die Herausforderung besteht darin, von einer relativ geringen Zahl an Experimenten zu lernen, indem man Rückschlüsse über die Objekte und ihre Physik zieht“, erklärt Rodriguez.

Der Roboterarm begann sein Training mit rund 300 praktischen Versuchen am Jenga-Turm. Er wählte mithilfe seiner Kamera zufällig einen Klotz aus und schob oder zog an ihm. Bei jedem dieser Versuche zeichnete sein Steuerungscomputer die visuellen Abläufe auf, registrierte die Kraft, die für das Bewegen des Klotzes nötig war und ob der Versuch mit einem Erfolg endete. Nun folgte der entscheidende Schritt: Auf Basis dieser Informationen bildete der Computer Gruppen ähnlicher Versuche und Ergebnisse. Für jede dieser Gruppen entwickelte er ein Modell, mit deren Hilfe er das Verhalten eines Bauklötzchens vorhersagen lernte. So erfasste er beispielsweise, dass ein relativ festsitzender Klotz beim Entfernen den Turm höchstwahrscheinlich zum Einsturz bringen würde.

Ähnlich gut wie menschliche Spieler

Die Cluster-Lernstrategie erwies sich als erfolgreich: Der Roboterarm schnitt nach seiner Trainingsphase kaum schlechter ab als menschliche Jenga-Spieler: „Wir schauten, wie viele Klötze ein Mensch im Schnitt entfernen konnte, bevor der Turm fiel – und der Unterschied zum Roboter war nicht sonderlich groß, berichtet Co-Autor Miquel Oller vom MIT. Gegenüber Robotersimulationen mit herkömmlichen Lernalgorithmen hatte der Roboterarm sogar den Finger vorn. Denn bei gleichen Ausgangsbedingungen benötigten seine Konkurrenten ein Vielfaches der Trainingseinheiten, um das Spiel ähnlich gut zu lernen.

Anzeige

Den Forschern geht es jedoch nicht darum, einen robotischen Jenga-Meister zu erzeugen – ihr Ziel ist weiter gefasst: „Es gibt viele Aufgaben, die wir mit unseren Händen erledigen und wo wir aus dem Tasten und dem Gefühl für die eingesetzte Kraft entscheidende Schlüsse ziehen“, erklärt Rodriguez. Sollen künftig Roboter in solchen Bereichen eingesetzt werden, müssen sie entsprechendes Fingerspitzengefühl besitzen und auch aus taktilen Reizen lernen können. „Ein Beispiel ist die Fließbandproduktion eines Smartphones: Bei fast jedem Schritt liefern der Widerstand einer eingedrehten Schraube oder das Einrasten eines Verschlusses Informationen über den Tastsinn und die Kraft statt nur über das Sehen“, so der Forscher. „Lernmodelle für solche Aktionen sind für diese Art der Technologie daher wichtig.“

Quelle: Nima Fazeli (Massachusetts Institute of Technology, Cambridge) et al., Science Robotics, doi: 10.1126/scirobotics.aav3123

Anzeige

bild der wissenschaft | Aktuelles Heft

Sonderpublikation in Zusammenarbeit  mit der Baden-Württemberg Stiftung

Jetzt ist morgen
Wie Forscher aus dem Südwesten die digitale Zukunft gestalten

Anzeige

Bücher

Wissenschaftslexikon

Got|tes|ur|teil  〈n. 11; im MA〉 Gerichtsverfahren, bei dem Gott durch ein Zeichen den Hinweis auf Schuld od. Unschuld gibt; Sy Gottesgericht ( ... mehr

Me|tall|fa|den|lam|pe  〈f. 19〉 Glühlampe mit Metallfaden

Wim|per|tier|chen  〈n. 14; Zool.〉 hochentwickeltes Protozoon mit einem großen u. einem kleinen Zellkern: Ciliata

» im Lexikon stöbern
Anzeige
Anzeige