Analyse von iterativen Kombination Auctions mit Multi-Agenten Verstärkungslernen
Dieses Papier untersucht, wie MARL das Verständnis von komplexen Auktionen verbessern kann.
― 14 min Lesedauer
Inhaltsverzeichnis
- Wie Multi-Agenten-Verstärkendes Lernen hilft
- Bedeutung von iterativen kombinatorischen Auktionen
- Die Herausforderung, Auktionen zu verstehen
- Die Rolle von Multi-Agenten-Verstärkendem Lernen
- Frühere Forschung zu Auktionen
- Einrichtung des Auktionsmodells
- Strategien zur Modellierung von Auktionen
- Kontrolle der Spielgrösse
- Auktionslänge
- Anzahl der Bieter
- Informationsverfügbarkeit
- Strategien unter Bietern
- Gleichgewichte mit MARL finden
- Die richtige Algorithmuswahl
- Mehrere Gleichgewichte
- Reine vs gemischte Gleichgewichte
- Vermeidung schlecht definierter Gleichgewichte
- Validierung und Verständnis von Politiken
- Bewertung der Konvergenz
- Interpretation mehrerer Gleichgewichte
- Fallstudie: Gebotsverarbeitung in Uhr-Auktionen
- Verständnis von Uhr-Auktionen
- Analyse der Gebotsverarbeitungsregeln
- Auktionsaufbau für die Analyse
- Bieten und Nutzenfunktionen
- Durchführung der Analyse
- Ergebnisse und Erkenntnisse
- Auswirkungen der Verarbeitungsregeln
- Einschränkungen einfacher Modelle
- Fazit und zukünftige Richtungen
- Vielversprechende Bereiche für weitere Studien
- Abschliessende Gedanken
- Originalquelle
- Referenz Links
Iterative kombinatorische Auktionen sind spezielle Arten von Auktionen, die in wichtigen Situationen genutzt werden, wie zum Beispiel beim Verkauf von Funkfrequenzen. Diese Auktionen können jedoch sehr kompliziert sein, was es den Bietern schwer macht, zu wissen, wie sie am besten agieren sollten. Das stellt auch eine Herausforderung für Auktionsgestalter dar, die Regeln schaffen wollen, die zu guten Ergebnissen führen, etwa zur Maximierung von Gewinnen oder zur Sicherstellung von Fairness.
In diesem Papier schauen wir uns an, ob ein neuer Ansatz namens Multi-Agenten-Verstärkendes Lernen (MARL) helfen kann, diese komplexen Auktionen zu analysieren. Kürzlich hat MARL in anderen Bereichen vielversprechende Ergebnisse gezeigt, deshalb wollten wir sehen, ob es auch hier funktionieren kann.
Wie Multi-Agenten-Verstärkendes Lernen hilft
Unsere Ergebnisse zeigen, dass MARL wertvolle Einblicke in das Auktionsverhalten geben kann. Es ist jedoch nicht einfach, es effektiv zu nutzen. Wir beginnen damit, zu erklären, wie man das Auktionsmodell so aufsetzt, dass es überschaubar bleibt, während wichtige Aspekte wie unvollständige Informationen oder Unterschiede zwischen den Bietern weiterhin berücksichtigt werden.
Wir warnen auch vor häufigen Problemen mit verschiedenen MARL-Algorithmen, wie man überprüfen kann, ob sie korrekt arbeiten, und wie man verschiedene mögliche Ergebnisse interpretiert. Wir demonstrieren unsere Methode, indem wir eine spezifische Änderung der Auktionsregeln analysieren und zeigen, wie sie die Auktionsergebnisse erheblich beeinflusst, basierend darauf, wie die Bieter sich verhalten.
Bedeutung von iterativen kombinatorischen Auktionen
Diese Auktionen spielen eine entscheidende Rolle beim Verkauf von Funkfrequenzen, was riesige Summen Geld und nationale Auswirkungen haben kann. Bei so hohen Einsätzen ist es wichtig, dass die Bieter kluge Entscheidungen treffen, da das Ergebnis den Wert ihres Unternehmens stark beeinflussen kann. In ähnlicher Weise müssen Auktionsgestalter Regeln erstellen, die Umsatz, Fairness und andere wichtige Faktoren verbessern.
Dennoch sind beide Aufgaben aufgrund der Komplexität von iterativen kombinatorischen Auktionen ziemlich herausfordernd. Die Notwendigkeit für die Bieter, ihre Präferenzen über mehrere Artikel hinweg auszudrücken, fügt der Bietdynamik zusätzliche Komplexität hinzu. Darüber hinaus macht die sich verändernde Natur dieser Auktionen die Vorhersage, wie verschiedene Regeländerungen die endgültigen Ergebnisse beeinflussen werden, kompliziert.
Die Herausforderung, Auktionen zu verstehen
Nehmen wir als Beispiel Frequenzauktionen. Die Regeln für diese Auktionen können über 50 Seiten lang sein und beschreiben, wie sie ablaufen und welche Gebote gültig sind. Sie finden selten statt, oft nur ein paar Mal über mehrere Jahre auf nationaler Ebene. Obwohl einige Auktionsformate üblicher sind, wie die Simultaneous Multiple Round Auctions (SMRA) und die Combinatorial Clock Auctions (CCA), können die Regeln selbst innerhalb desselben Formats erheblich variieren.
Angesichts dieser Unberechenbarkeit ist es entscheidend, Methoden zu entwickeln, um zu analysieren, wie Regeländerungen die Auktions Ergebnisse beeinflussen könnten. Der beste Weg, dies zu tun, besteht darin, die Bayes-Nash-Gleichgewichte für die Regeln jeder Auktion zu berechnen, was eine gründliche Bewertung der erwarteten Ergebnisse ermöglicht. Allerdings funktioniert die traditionelle Stift-und-Papier-Analyse aufgrund der Komplexität iterativer kombinatorischer Auktionen einfach nicht.
Die meisten bestehenden Studien haben sich auf viel einfachere Auktionsformate konzentriert. Zum Beispiel wurde in einem einfacheren Auktionsformat gezeigt, dass Bieter die Auktion in der ersten Runde beenden können, aber das gilt nur, wenn es ein einzelnes Produkt gibt und alle Informationen bekannt sind.
Die Rolle von Multi-Agenten-Verstärkendem Lernen
Angesichts der genannten Komplikationen ist eine Alternative, die Auktion basierend auf einer festen Strategie für die Bieter zu simulieren. Dieser Ansatz ermöglicht es uns zu beobachten, wie verschiedene Regeländerungen die Auktions Ergebnisse beeinflussen können, unter Berücksichtigung, wie sich die Präferenzen der Bieter und zufällige Elemente in der Auktion selbst verändern könnten.
Typische kombinatorische Auktionen sind jedoch nicht so gestaltet, dass sie strategiefest sind, was bedeutet, dass es normalerweise keine einzige Strategie gibt, die in allen Szenarien am besten funktioniert. MARL bietet ein Gleichgewicht, indem es den Agenten ermöglicht, anspruchsvollere Überlegungen anzustellen und gleichzeitig leichter zu berechnen ist als klassische Gleichgewichts Methoden.
In den letzten Jahren hat MARL erhebliche Fortschritte gemacht. Viele frühe Projekte konzentrierten sich darauf, in Zwei-Spieler-Nullsummenspielen wie Schach und Go hohe Leistungen zu erreichen. Diese Spiele haben einen einzigartigen Aspekt, bei dem die Spieler nicht mit der Auswahl von Gleichgewichten umgehen müssen; wenn ein Spieler seinen Teil der Gleichgewichtsstrategie folgt, wird er mindestens so gut abschneiden wie jede andere Strategie, die der Gegner verwendet.
Diese Eigenschaft gilt jedoch nicht in Auktionen oder in Spielen mit mehr als zwei Spielern. Dennoch haben jüngste Entwicklungen übermenschliche Fähigkeiten in Multiplayer-Nullsummenspielen wie Poker demonstriert.
Eine bemerkenswerte MARL-Methode ist die Counterfactual Regret Minimization (CFR), die für ihre Effektivität in Pokerszenarien bekannt ist. Ein weiterer beeindruckender Fortschritt war die Schaffung von Agenten, die Diplomacy auf hohem Niveau spielen können, was ebenfalls komplexe, facettenreiche Entscheidungen ähnelt wie bei unseren Auktionsfragen.
Im Kontext von hochkarätigen Auktionen gibt es kein unmittelbares Interesse an der Verwendung automatisierter Bots, um im Namen grosser Unternehmen zu bieten. Stattdessen kann MARL von unschätzbarem Wert sein, um konkurrierende Auktionsdesigns zu bewerten und Einblicke in wirtschaftliche Faktoren, einschliesslich Umsatz und Effizienz, zu gewinnen.
Frühere Forschung zu Auktionen
Derzeit gibt es nur begrenzte Studien, die Verstärkendes Lernen speziell für die Auktionsanalyse verwenden. Einige Forschungen haben strategisches Verhalten in ersten und zweiten Preisauktionen untersucht und argumentiert, dass es in schnelllebigen Online-Werbeauktionen entscheidend ist, wie diese Algorithmen interagieren, anstatt sich nur auf Gleichgewichtverhalten zu konzentrieren.
Andere Studien haben versucht, tiefe MARL-Methoden zu verwenden, um Gleichgewichte in Einer-Runden-Auktionen zu finden. Einige haben versucht, heuristische Strategien mit Monte-Carlo-Baumsuchmethoden zu kombinieren, um effektive Biettaktiken zu finden, aber diese Bemühungen betreffen meist Szenarien mit vollständigen Informationen.
Unser Papier zielt darauf ab, MARL für eine umfassende Analyse iterativer kombinatorischer Auktionen zu nutzen, bei denen Informationen unvollständig sind. Diese Einblicke könnten den Bietern helfen, kluge Strategien zu entwickeln, indem sie starke Bietbeispiele demonstrieren und ihren Entscheidungsprozess leiten.
Ebenso könnten Auktionsgestalter von dieser Analyse profitieren, um die Auswirkungen potenzieller Regeländerungen auf kritische Faktoren wie Umsatz und Fairness zu messen.
Einrichtung des Auktionsmodells
Beim Implementieren von MARL für die Auktionsanalyse funktioniert es nicht einfach, die gesamten Auktionsregeln in eine MARL-Umgebung zu übersetzen. Dadurch entsteht ein Spiel, das zu gross ist, um es effektiv zu lösen. Wie bei der Stift-und-Papier-Analyse ist es notwendig, bestimmte Elemente zu vereinfachen, um andere wesentliche Aspekte besser zu erfassen.
Einige Komplexitäten, wie etwa wie die Gewinngebote bestimmt werden oder einzigartige Regelungen zum Brechen von Gleichständen, können durch MARL bewältigt werden. Auf der anderen Seite können einige Auktionselemente die Zahl der verfügbaren Aktionen dramatisch erhöhen, wie etwa Möglichkeiten für Bieten innerhalb der Runde oder verschiedene Ansätze für Aktivitätsregeln.
Wir empfehlen, mit einfacheren, leichter zu verwaltenden Auktionen zu beginnen und allmählich die Komplexität zu erhöhen. Es ist überraschend, wie selbst moderat komplizierte Auktionen zu riesigen Spielbäumen führen können, die es schwierig machen, zuverlässige Ergebnisse mit MARL-Algorithmen zu erzielen.
Strategien zur Modellierung von Auktionen
Hier diskutieren wir einige entscheidende Strategien, die bei der Gestaltung eines Auktionsmodells für die MARL-Analyse zu beachten sind.
Kontrolle der Spielgrösse
Ein Schlüsselfaktor in der Auktionsmodellierung ist die Anzahl der unterschiedlichen Informationszustände im Spiel. Je mehr Aktionsmöglichkeiten jedem Spieler zur Verfügung stehen, desto grösser wird der Spielbaum. Die Kontrolle des Aktionsraums ist entscheidend, um unnötige Komplikationen zu beseitigen, indem die Anzahl der Waren oder die Menge für jeden Artikel begrenzt wird.
Es ist jedoch wichtig, die Auktion nicht auf ein einziges Produkt zu reduzieren, da dies signifikantes strategisches Verhalten auslassen würde. Stattdessen schlagen wir vor, mit zwei oder drei Produkten zu beginnen, um ein klareres Bild der Bietdynamiken zu liefern.
Ein hilfreicher Ansatz ist es, die Bieter auf eine begrenzte Menge an Strategien zu beschränken. Dies kann beinhalten, dass sie nur eine kleine Anzahl von Bietoptionen in jeder Phase ausdrücken dürfen. Dabei muss jedoch darauf geachtet werden, dass dies die Spieler nicht daran hindert, effektiv auf die Strategien der anderen zu reagieren.
Indem man mit einem kontrollierten Aktionsraum beginnt, wird es einfacher für die Agenten, nützliche Gesamtstrategien zu lernen.
Auktionslänge
In der Realität können Frequenzauktionen eine Vielzahl von Runden in Anspruch nehmen. Für die MARL-Analyse kann dies direkte Herausforderungen darstellen, da die Grösse des Spielbaums exponentiell wachsen kann. In der realen Welt sehen Auktionen oft wiederholte Gebote mit kleinen Preiserhöhungen über viele Runden, wobei die Aktion auf einige Schlüsselmomente konzentriert wird.
Um die Dinge überschaubar zu halten, raten wir, Auktionen auf etwa zehn Runden zu begrenzen. In einigen Fällen können sogar zwei oder drei Runden wichtige wirtschaftliche Einblicke bieten. Es gibt oft weniger Wert in der Analyse von langen Auktionen, da die Dynamik repetitiv werden kann.
Anzahl der Bieter
In der Praxis können Frequenzauktionen viele Bieter umfassen. Doch viele dieser Bieter sind kleinere Telekommunikationsunternehmen mit begrenzter Fähigkeit, erhebliche Gebote abzugeben. Wenn kleinere Bieter in das Modell einbezogen werden müssen, sollte überlegt werden, ob sie die Freiheit haben sollten, strategisch zu agieren oder ob eine einfachere, deterministische Strategie ausreicht.
Informationsverfügbarkeit
Auktionen können mit perfekten oder unvollkommenen Informationen modelliert werden. Szenarien mit perfekten Informationen führen oft zu unrealistischem Bieterverhalten, bei dem sie ihre Aktionen effektiver koordinieren können, als es in der Realität der Fall wäre. Daher ist es besser, Auktionen als Bayes'sche Spiele zu modellieren, bei denen die Bieter Unsicherheiten über die Werte der anderen haben.
Strategien unter Bietern
Die Verwendung symmetrischer Modelle für Bieter bietet einige technische Vorteile, da Symmetrie die Komplexität bei der Suche nach Gleichgewichten reduzieren kann. Allerdings haben Bieter in Frequenzauktionen oft unterschiedliche Ressourcen und Ziele. Diese Unterschiede in einem MARL-Umfeld zu modellieren, ermöglicht realistischere Simulationen.
Gleichgewichte mit MARL finden
Jetzt wechseln wir dazu, wie man MARL nutzen kann, um Strategien zu finden, die den Gleichgewichten in diesen Auktionen nahekommen.
Die richtige Algorithmuswahl
MARL-Algorithmen können in tabellarische Methoden und Methoden zur Funktionsaproximation unterteilt werden.
Tabellarische Methoden verfolgen spezifische Spielzustände und generalisieren nicht über ähnliche Zustände. Dies kann zu unberechenbarem Verhalten in seltenen Situationen führen. Methoden zur Funktionsaproximation hingegen ermöglichen es den Spielern, Wissen aus einem Teil des Spiels auf einen anderen anzuwenden.
Obwohl beide Methoden ihre Vor- und Nachteile haben, ist es oft sinnvoll, mit einer tabellarischen Methode zu beginnen, die wesentliche Teile des Spielbaums abdecken kann.
Mehrere Gleichgewichte
Komplexe Auktionen haben oft viele Gleichgewichte. Um diese mit MARL zu finden, sollten Algorithmen mit verschiedenen Zufallsseed-Werten betrieben werden. Dieses Zufallselement hilft, unterschiedliche potenzielle Ergebnisse abzudecken und das Verständnis für das Bieterverhalten zu verbessern.
Allerdings kann es problematisch werden, wenn zwei oder mehr Aktionen zur gleichen terminalen Belohnung führen, da Algorithmen möglicherweise keine von ihnen bevorzugen. Eine Förderung kleiner „sekundärer“ Belohnungen kann Spieler in Richtung optimaler Strategien lenken.
Reine vs gemischte Gleichgewichte
Je nach Auktionsbedingungen kann man sich entscheiden, sich auf reine Gleichgewichte anstelle von gemischten für die Analyse zu konzentrieren. Reine Gleichgewichte können den Prozess vereinfachen und es erleichtern, Politiken zu trainieren und zu bewerten.
Wenn interessantes Verhalten nur in gemischten Gleichgewichten erwartet wird, muss sorgfältig über den MARL-Algorithmus nachgedacht werden, da er möglicherweise bestimmte Strategien nicht genau darstellen kann.
Vermeidung schlecht definierter Gleichgewichte
In der Praxis können trainierte Strategien schlecht abschneiden, wenn sie neuen Gegnern gegenüberstehen. Dies liegt oft an zerbrechlichen Gleichgewichten, bei denen die Spieler von perfekter Koordination abhängen, was in den meisten Situationen nicht nachhaltig ist.
Um dieses Problem zu bekämpfen, kann es hilfreich sein, dass Politiken während des Trainings „zittern“, indem sie etwas Zufälligkeit in ihren Entscheidungen einführen, um robustere Strategien zu entwickeln.
Validierung und Verständnis von Politiken
Sobald ein Satz von Politiken mit einer MARL-Ansatz trainiert wurde, ist es wichtig, auf Konvergenz zu prüfen und die Ergebnisse effektiv zu interpretieren.
Bewertung der Konvergenz
Zu verstehen, ob ein MARL-Algorithmus ein Gleichgewicht erreicht, ist entscheidend. Ein Mass, das als NashConv bekannt ist, kann dies anzeigen und zeigen, wie gut Spieler ihren Nutzen verbessern können, indem sie die Strategien ändern. Obwohl ideal, ist es oft schwierig, in komplexen Spielen zu berechnen.
Wenn genaue Bewertungen nicht durchführbar sind, können Annäherungen Einblicke in die Effektivität der analysierten Strategien bieten.
Interpretation mehrerer Gleichgewichte
Wenn man mit mehreren Gleichgewichten konfrontiert ist, kann dies die Analyse komplizieren. Anstatt sie basierend darauf zu bewerten, wie wahrscheinlich sie sind, könnte es hilfreicher sein, die Palette potenzieller Strategien oder Ergebnisse zu betrachten, die von allen Gleichgewichten dargestellt werden.
Fallstudie: Gebotsverarbeitung in Uhr-Auktionen
Um unsere Methodik zu demonstrieren, betrachten wir genauer die Uhr-Auktionen, die ein modernes Format iterativer kombinatorischer Auktionen sind, und konzentrieren uns darauf, wie Gebote verarbeitet werden, wenn mehrere Bieter Produkte abgeben möchten.
Verständnis von Uhr-Auktionen
In einer Uhr-Auktion verkauft ein Auktionator Lizenzen für das Funkfrequenzspektrum an Bieter, die Telekommunikationsunternehmen vertreten. Die Auktion verläuft über mehrere Runden, in denen Bieter ihre Anforderungen zu festgelegten Preisen abgeben. Falls die Nachfrage das Angebot für ein Produkt übersteigt, werden die Preise erhöht. Wenn nicht, endet die Auktion mit den Bietern, die die Lizenzen gewonnen haben, für die sie geboten haben.
Mehrere Regeln fügen der Uhr-Auktion Komplexität hinzu, einschliesslich Berechtigungspunkte, um die Bietoptionen der Bieter basierend auf vorherigen Runden zu begrenzen, und Regeln, die verhindern, dass Lizenzen unverkauft bleiben.
Analyse der Gebotsverarbeitungsregeln
Der Auktionator muss entscheiden, wie er Gebote verarbeitet, wenn mehrere Bieter gleichzeitig Lizenzen abgeben möchten. Ein häufiger Ansatz ist es, die Anfragen zufällig zu sortieren und sie entsprechend zu bearbeiten. Ein alternativer Ansatz könnte darin bestehen, individuelle Lizenzanfragen separat zu behandeln, was möglicherweise unterschiedliche Ergebnisse im Auktionsverhalten zur Folge hat.
Mit der MARL-Methodologie können wir diese beiden unterschiedlichen Verarbeitungsmechanismen analysieren, um zu sehen, wie sie die Bietstrategien und die endgültigen Auktionsresultate beeinflussen.
Auktionsaufbau für die Analyse
Für diese Analyse betrachten wir Auktionen mit zwei Bietern und konzentrieren uns auf zwei Produkte: eines mit einer einzelnen Lizenz und eines mit mehreren belasteten Lizenzen. Jedes hat einen bestimmten Startpreis, und wir treffen Annahmen darüber, wie die Auktion basierend auf dem bisherigen Verhalten der Bieter abläuft.
Bieten und Nutzenfunktionen
Jeder Bieter hat eine Reihe von Typen, die seine Nutzenfunktionen beeinflussen, die bestimmen, wie viel Wert sie aus dem Gewinn von Lizenzen ziehen. Die Nutzen der Bieter werden auf Basis von Parametern wie Marktanteil und Wert pro Abonnent modelliert, was zu komplexen Entscheidungsfindungsszenarien führt.
Durchführung der Analyse
Als Nächstes implementieren wir die Auktion mithilfe unseres MARL-Rahmens und führen Experimente unter beiden Verarbeitungsmechanismen durch. Unser Ziel ist es, herauszufinden, wie die Wahl der Regeln den gesamten Umsatz, die Dauer der Auktion und die Anzahl der unverkauften Lizenzen beeinflusst.
Ergebnisse und Erkenntnisse
Nach Durchführung unserer Experimente analysieren wir die Ergebnisse aus den verschiedenen Auktionsszenarien. Wie erwartet, führen die Verarbeitungsregeln zu unterschiedlichen Bietverhalten und Auktionsausgängen.
Auswirkungen der Verarbeitungsregeln
Die Wahl der Gebotsverarbeitungsregel hat einen erheblichen Einfluss auf die Länge der Auktion und die Umsatzgenerierung. Die Bieter passen ihre Strategien basierend auf dem verwendeten Mechanismus an, und wir stellen fest, dass unter bestimmten Bedingungen eine Verarbeitungsregel bessere Ergebnisse liefern kann als eine andere.
Einschränkungen einfacher Modelle
Wenn man die Ergebnisse von einfachen Bietern beobachtet, wird klar, dass das Ignorieren tieferer Bietanreize zu irreführenden Schlussfolgerungen führen kann. Auktionen, die ohne Berücksichtigung strategischen Verhaltens modelliert werden, riskieren, wichtige Einblicke darüber zu verpassen, wie die Teilnehmer auf Regeländerungen reagieren.
Fazit und zukünftige Richtungen
Die Ergebnisse heben die Effektivität von MARL für die Auktionsanalyse hervor und zeigen dessen Potenzial, wertvolle Einblicke in komplexe Prozesse wie iterative kombinatorische Auktionen zu bieten. Die Exploration in diesem Papier ist jedoch nur der Anfang.
Vielversprechende Bereiche für weitere Studien
Es gibt mehrere Bereiche, in denen Verbesserungen möglich sind, und Fragen, die in zukünftiger Forschung behandelt werden sollten. Zum Beispiel könnte eine detailliertere Untersuchung, wie Designentscheidungen in Auktionen das Verhalten beeinflussen, fruchtbar sein. Weitere vielversprechende Möglichkeiten umfassen die Verbesserung unserer Methodologie und die Auseinandersetzung mit theoretischen Fragen hinsichtlich der Konvergenz und alternativen Lösungskonzepten.
Abschliessende Gedanken
Die Anwendung von MARL zur Auktionsanalyse eröffnet spannende Möglichkeiten, um komplexe Bietumgebungen besser zu verstehen. Es öffnet Türen für neue Erkenntnisse, die sowohl Bietern als auch Auktionsgestaltern helfen könnten, informierte Entscheidungen in einer sich ständig verändernden Landschaft zu treffen.
Titel: Understanding Iterative Combinatorial Auction Designs via Multi-Agent Reinforcement Learning
Zusammenfassung: Iterative combinatorial auctions are widely used in high stakes settings such as spectrum auctions. Such auctions can be hard to analyze, making it difficult for bidders to determine how to behave and for designers to optimize auction rules to ensure desirable outcomes such as high revenue or welfare. In this paper, we investigate whether multi-agent reinforcement learning (MARL) algorithms can be used to understand iterative combinatorial auctions, given that these algorithms have recently shown empirical success in several other domains. We find that MARL can indeed benefit auction analysis, but that deploying it effectively is nontrivial. We begin by describing modelling decisions that keep the resulting game tractable without sacrificing important features such as imperfect information or asymmetry between bidders. We also discuss how to navigate pitfalls of various MARL algorithms, how to overcome challenges in verifying convergence, and how to generate and interpret multiple equilibria. We illustrate the promise of our resulting approach by using it to evaluate a specific rule change to a clock auction, finding substantially different auction outcomes due to complex changes in bidders' behavior.
Autoren: Greg d'Eon, Neil Newman, Kevin Leyton-Brown
Letzte Aktualisierung: 2024-07-23 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2402.19420
Quell-PDF: https://arxiv.org/pdf/2402.19420
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.