Videospiele sind der größte Wirtschaftszweig der Unterhaltungsindustrie. Sie erreichen rund drei Milliarden Menschen weltweit und generieren mehr Umsätze als Filme, Serien und Musik zusammen. In vielen kreativen Bereichen hat inzwischen künstliche Intelligenz Einzug gehalten, um Menschen bei der Generierung und Umsetzung von Ideen zu unterstützen. „Studien haben jedoch gezeigt, dass die generativen KI-Fähigkeiten oft hinter den Erwartungen der Kreativen zurückbleiben, was die Integration dieser Technologien in die kreative Praxis vor große Herausforderungen stellt“, erklärt ein Team um Anssi Kanervisto von Microsoft Research in Cambridge.
Training mit Gameplay-Daten
Um herauszufinden, was eine KI leisten muss, um tatsächlich ein nützlicher Helfer für die Entwicklung von Videospielen zu sein, haben Kanervisto und sein Team 27 Spieleentwickler zu ihren Wünschen und Anforderungen befragt. „Dabei wurde deutlich, dass divergentes Denken und eine iterative Praxis eine wichtige Rolle spielen“, berichten die Forschenden. Das bedeutet, dass die KI in der Lage sein sollte, viele verschiedene Ideen zu entwickeln und zudem ermöglichen sollte, das Ergebnis im Wechselspiel mit dem menschlichen Entwickler immer weiter zu verfeinern. Wichtig sei zudem, dass die KI-generierten Vorschläge mit der Logik und Atmosphäre der Spielwelt konsistent sind.
Auf Basis dieser Vorgaben trainierten die Forschenden ein KI-Modell, dem sie den Namen “World and Human Action Model” (WHAM) gaben. Als Trainingsdaten dienten menschliche Gameplays des 3D-Kampfspiels Bleeding Edge. Das KI-System lernte so die Gesetzmäßigkeiten, den Look und das Spielprinzip und konnte darauf basierend nun selbst Computerspielszenen erstellen. „WHAM kann konsistente und vielfältige Spielsequenzen generieren und Modifikationen des Nutzers überdauern – drei entscheidende Fähigkeiten für den Einsatz in der Praxis“, erklärt das Team.
Unterstützung für menschliche Entwickler
Über eine Benutzeroberfläche können Spieleentwickler mit der KI interagieren. Beispielsweise können sie als Eingabe ein einzelnes Bild verwenden, aus dem WHAM vollständige Spielsequenzen generiert. Diese folgen der Spielmechanik von Bleeding Edge, weisen vielfältige Leveldesigns auf und vermeiden logische Fehler – etwa, dass ein Spielercharakter plötzlich seine Form oder sein Bewegungsmuster ändert. Zudem ermöglicht WHAM, dass die Entwickler die Ausgabe verfeinern. Auf einer grafischen Oberfläche lassen sich beispielsweise neue Elemente in die Sequenz einfügen – etwa neue Gegner oder Ausrüstungsgegenstände –, die WHAM sinnvoll integriert.
Die Forschenden gehen davon aus, dass die Ergebnisse auch auf weitere Anwendungen übertragbar sind. „Da WHAM die relevanten Strukturen ausschließlich aus Spieldaten und ohne vorheriges Fachwissen erlernt hat, gehen wir davon aus, dass sich diese Ergebnisse auf eine breite Palette bestehender Spiele übertragen und schließlich auf neue Spiele und Genres verallgemeinern lassen“, erklärt das Forschungsteam. Wichtig für die zukünftige Entwicklung von KI für den Kreativbereich sei, die Anforderungen der Anwender in den Mittelpunkt zu stellen und Tools zu entwickeln, die die menschliche Kreativität nicht ersetzen, sondern unterstützen.





