Kontrollierbarer Zerstörungspfad: Ein neuer Ansatz für die Inhaltserstellung
Eine Methode, um Computern beizubringen, Spiellevel und Modelle zu erstellen und anzupassen.
― 8 min Lesedauer
Inhaltsverzeichnis
Der Path of Destruction (PoD) ist ein Ansatz, um Computern beizubringen, wie sie Dinge erstellen können, indem sie aus Beispielen lernen. Anstatt mit perfekten Objekten zu starten, beginnt PoD mit beschädigten Objekten und lernt, wie man sie repariert. Die Idee ist, etwas Stück für Stück auseinanderzunehmen und dabei ein Datenset von Veränderungen zu erstellen. Jedes Mal, wenn etwas auseinander genommen wird, wird festgehalten, was geändert wurde und wie man es reparieren kann. Dieser Ansatz funktioniert gut für Dinge wie Videospielebenen oder 3D-Modelle.
Die Basics von Path of Destruction
Die ursprüngliche PoD-Methode funktioniert, indem sie ein einfaches Objekt oder Level nimmt und es nach und nach beschädigt. Wenn du zum Beispiel mit einem Level eines Spiels anfängst, könntest du ein paar Blöcke verändern und schauen, was passiert. Du erstellst eine Aufzeichnung dieser Änderungen und nutzt sie, um einem Computer beizubringen, wie man neue Levels erstellt, indem man sie von zufälligen Ausgangspunkten repariert. Diese Methode ist praktisch, weil sie nicht viele Beispiele braucht, um zu lernen.
Ein grosser Vorteil von PoD ist, dass es mit sehr wenig Anfangsdaten arbeiten kann. Du könntest mit nur fünf Levels eines Spiels anfangen und trotzdem viele neue Levels erstellen. Allerdings erlaubte die ursprüngliche Version den Nutzern nicht, zu steuern, wie die neuen Levels erstellt wurden. Die einzige Möglichkeit, den Computer zu lenken, war, die Ausgangsbeispiele sorgfältig auszuwählen. Das liess wenig Raum für Anpassungen.
Einführung in den kontrollierbaren Path of Destruction
Die neue Version, die Controllable Path of Destruction heisst, bringt einen Twist, indem sie den Nutzern mehr Einfluss darauf gibt, wie die neuen Objekte erstellt werden. Indem zusätzliche Informationen oder Bedingungen zu den Trainingsdaten hinzugefügt werden, können Designer Dinge wie die Anzahl der Feinde in einem Spiel oder die Komplexität eines Levels beeinflussen. Das eröffnet kreative Möglichkeiten für Spielentwickler oder alle, die neue Inhalte erstellen.
Wenn ein Designer zum Beispiel ein Level mit einer bestimmten Anzahl an Feinden erstellen möchte, kann er das während des Designprozesses angeben. Der Computer nutzt diese Informationen, um die Generierung neuer Levels zu leiten, was es besser an die Wünsche des Designers anpasst.
Wie es funktioniert
In der kontrollierbaren Version wird beim Erstellen der Trainingsdaten zusätzliche Informationen über den ursprünglichen Zustand des Objekts, das zerstört wird, aufgezeichnet. Wenn das Ziel ist, eine bestimmte Anzahl von Objekten zu haben, wird diese Information neben den vorgenommenen Änderungen in die Trainingsdaten aufgenommen. Wenn ein Level also sieben Feinde hat, wird das als Teil des Trainingsprozesses festgehalten.
Um es noch besser für Situationen mit wenig Daten zu machen, nutzt der Ansatz „signed inputs“. Anstatt nur exakte Zahlen aufzuzeichnen, wird festgehalten, ob der aktuelle Zustand über, unter oder genau beim gewünschten Ziel liegt. Das bedeutet, dass, wenn das Ziel fünf Feinde sind und es acht gibt, die Eingabe anmerkt, dass es reduziert werden muss. Diese Methode hilft dem Computer, besser zu lernen, weil er mehr Variationen hat, auf denen er aufbauen kann.
Testen der Methode
Es wurden zwei Hauptbereiche getestet: die Generierung von Levels für ein einfaches 2D-Dungeon-ähnliches Spiel und die Erstellung kleiner 3D-Lego-Autos. Die Dungeon-Levels basierten auf einem berühmten Videospiel, bei dem die Spieler Feinden ausweichen und Schlüssel sammeln müssen, um zu gewinnen. Das Ziel war es, Levels zu erstellen, die spielbar sind, was bedeutet, dass sie einen klaren Anfang und ein Ende haben und einen Weg für den Spieler bieten, seine Ziele zu erreichen.
Bei den Lego-Autos lag der Fokus darauf, wie viele Blöcke in der Konstruktion verwendet werden. Die Nutzer gaben an, wie viele Blöcke sie wollten, und das System generierte Autos innerhalb dieses Bereichs. Die Flexibilität der Methode erlaubt verschiedene Stile und Kombinationen, was die Kreationen interessanter macht.
Ergebnisse der Tests
Im Test konnte der controllable Path of Destruction spielbare Levels und Autos erstellen. Bei den Spiellevels lernte die Methode, Parameter wie die Anzahl der Feinde und den Abstand zwischen dem Spieler und dem nächsten Feind anzupassen. Allerdings war die Anzahl der Feinde eine Herausforderung, da die Trainingsdaten begrenzt waren, was zeigte, dass vielfältigere Beispiele das Ergebnis verbessern könnten.
Die generierten Dungeon-Levels wurden anhand ihrer Qualität und Einzigartigkeit bewertet. Ein gutes Zeichen für den Erfolg war die Anzahl der erstellten spielbaren Levels. Die Ergebnisse zeigten, dass viele dieser Levels tatsächlich spielbar und unterschiedlich waren.
Im Fall der Lego-Autos zeigte die Methode ihre Fähigkeit, zufällige Ausgangszustände in funktionale Autos zu „reparieren“. Sie erzielte einen hohen Ähnlichkeitswert von rund 80 %, wenn die generierten Autos mit den ursprünglichen Zielautos verglichen wurden. Das bedeutet, dass das System ziemlich gut darin war, aus einer durcheinander geworfenen Mischung von Lego-Blöcken wieder aufzubauen.
Ein detaillierter Blick auf die Zelda-Levels
Bei den Zelda-Levels wurden drei Hauptparameter gesteuert: die Anzahl der Feinde, der Abstand zum nächsten Feind und die Gesamtlänge des Weges, den ein Spieler zurücklegen muss, um zu gewinnen. Jeder dieser Parameter beeinflusst, wie das Spiel erlebt wird. Eine höhere Anzahl von Feinden kann mehr Action bedeuten, während näher gelegene Feinde die Intensität des Spiels erhöhen.
Die Verwendung einer grossen Vielfalt von Levelbeispielen half, das Verständnis des Modells dafür zu verbessern, wie man Levels mit diesen Parametern erstellt. Das Ziel war es, Levels zu generieren, die die Spieler als spassig und herausfordernd empfinden würden.
Das Modell schnitt gut ab, wenn es um die Steuerung des Abstands zum nächsten Feind und die Weglänge ging. Es hatte jedoch Schwierigkeiten, die Anzahl der Feinde zu kontrollieren, da die Trainingsbeispiele oft ziemlich ähnlich waren. Das zeigt eine Notwendigkeit für vielfältigere Trainingsdaten, um die Fähigkeit des Systems zu verbessern, mit einer breiteren Palette von Parametern zu arbeiten.
Die Qualität der generierten Levels wurde beurteilt, indem überprüft wurde, wie viele spielbar waren und wie einzigartig sie im Vergleich zu den ursprünglichen Trainingslevels waren. Die Ergebnisse zeigten, dass das System eine gute Anzahl spielbarer Levels produzierte und dabei eine vielfältige Auswahl aufrechterhielt.
Untersuchung der Lego-Auto-Erstellung
Bei den Lego-Autos lag der Hauptfokus darauf, die Anzahl der verwendeten Blöcke bei der Erstellung zu steuern. Die Methode erlaubte eine einfache Überprüfung, ob das generierte Auto die gewünschte Anzahl erfüllte. Die Tests beinhalteten die Nutzung eines begrenzten Datensatzes von 15 Zielautos, was ausreichend für das Modell war, um erfolgreich zu lernen.
Das Modell zeigte seine Fähigkeit, funktionale Autos aus zufälligen Lego-Anordnungen zu erstellen. Es stellte sicher, dass jedes erstellte Auto vier Räder hatte, was eine wichtige Eigenschaft für jedes Auto ist.
Die Möglichkeit, die Anzahl der Blöcke zu steuern, verbesserte den Generierungsprozess, da die Nutzer angeben konnten, wie viele Teile in ihre Auto-Designs eingearbeitet werden sollten. Diese Flexibilität machte das System nützlicher für alle, die benutzerdefinierte Lego-Fahrzeuge erstellen möchten.
Zukünftige Verbesserungen
Die aktuelle Methode zeigt Potenzial, aber es gibt noch Bereiche, in denen man sich verbessern kann. Ein grosses Manko war zum Beispiel die Zerstörungsmethode, die verwendet wurde, um das Datenset für das Training zu erstellen. In Zukunft könnte ein schlauerer Ansatz entwickelt werden, um sicherzustellen, dass alle notwendigen Bedingungen in den Daten vertreten sind. Das könnte bei Situationen helfen, in denen eine spezifische Kombination selten gesehen wird.
Eine weitere interessante Idee wäre, den controllable Path of Destruction mit anderen Methoden der Inhaltserstellung zu kombinieren. Methoden, die verstärkendes Lernen verwenden, könnten dazu beitragen, die generierten Inhalte noch weiter zu verfeinern und sicherzustellen, dass die generierten Levels und Objekte spezifische Kriterien effektiver erfüllen.
Fazit
Der controllable Path of Destruction bietet eine aufregende Möglichkeit für sowohl Spielentwickler als auch Designer, die neue interaktive Inhalte erstellen möchten. Indem mehr Kontrolle für die Nutzer über die Eigenschaften der generierten Artefakte ermöglicht wird, eröffnet die Methode einen neuen Ansatz für die Inhaltserstellung im Gaming und darüber hinaus.
Ob komplexe Levels für ein Spiel generiert oder einzigartige Lego-Modelle entworfen werden, zeigt diese Methode, dass Computer starke Verbündete im kreativen Prozess sein können. Je besser die Technologie wird und je vielfältiger die Trainingsdaten zur Verfügung stehen, desto besser und besser auf die Absichten der Nutzer abgestimmt dürften die Ergebnisse werden, was zu endlosen Möglichkeiten in der Inhaltserstellung führt.
Titel: Controllable Path of Destruction
Zusammenfassung: Path of Destruction (PoD) is a self-supervised method for learning iterative generators. The core idea is to produce a training set by destroying a set of artifacts, and for each destructive step create a training instance based on the corresponding repair action. A generator trained on this dataset can then generate new artifacts by repairing from arbitrary states. The PoD method is very data-efficient in terms of original training examples and well-suited to functional artifacts composed of categorical data, such as game levels and discrete 3D structures. In this paper, we extend the Path of Destruction method to allow designer control over aspects of the generated artifacts. Controllability is introduced by adding conditional inputs to the state-action pairs that make up the repair trajectories. We test the controllable PoD method in a 2D dungeon setting, as well as in the domain of small 3D Lego cars.
Autoren: Matthew Siper, Sam Earle, Zehua Jiang, Ahmed Khalifa, Julian Togelius
Letzte Aktualisierung: 2023-05-31 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2305.18553
Quell-PDF: https://arxiv.org/pdf/2305.18553
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.