Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Mathematik# Künstliche Intelligenz# Wahrscheinlichkeitsrechnung

Risikoaversion durch wiederholte Wetten einschätzen

Dieser Artikel untersucht, wie Leute Entscheidungen unter Risiko in verschiedenen Glücksspiel-Szenarien treffen.

― 10 min Lesedauer


Risikoentscheidungen beiRisikoentscheidungen beiwiederholten WettenRisiko und Vermögensdynamik.Analyse von Entscheidungsfindern unter
Inhaltsverzeichnis

Wiederholte Wetten sind nützlich, um zu verstehen, wie Menschen und Entscheidungsträger mit Risiken umgehen. Die Fähigkeit, die Risikoaversion einer Person zu erkennen, hängt davon ab, welche Art von Wetten angeboten werden und wie oft sie das Spiel spielen. Dieser Artikel betrachtet die Herausforderungen, die sich ergeben, wenn man die Risikoaversion anhand der Entscheidungen von künstlichen Agenten bei diesen wiederholten Wetten herausfinden will.

Wenn Agenten einer Reihe wiederholter Wetten gegenüberstehen, wählen sie oft Strategien, die darauf abzielen, ihr Vermögen im Laufe der Zeit zu maximieren. Die Strategien für diese Wetten können unterschiedlich sein. Bei additiven Wetten hängen die Ergebnisse nicht vom aktuellen Vermögen des Agenten ab. Bei multiplikativen Wetten sind die Ergebnisse proportional zum Vermögen des Agenten. Um die Risikoaversion genau zu messen, ist es wichtig zu bestimmen, ob der Agent die bestmögliche Strategie verwendet.

Um eine Vielzahl von Wettarten abzudecken, verwenden wir eine Technik namens Yeo-Johnson-Transformation, die hilft, ein Set von Wetten zu schaffen, das sanft zwischen additiven und multiplikativen Szenarien übergeht. Wir analysieren auch die besten Strategien für diese Arten von Wetten, sowohl mathematisch als auch durch Simulationen.

Eine Erkenntnis ist, dass es schwieriger wird, die Agenten anhand ihrer Risikoaversion zu unterscheiden, wenn ihr Vermögen wächst. Schliesslich werden Agenten mit unterschiedlichen Risikostilen ähnliche Entscheidungen treffen, wenn sie genug Vermögen haben. Diese Einblicke können das Design von Experimenten verbessern, die darauf abzielen, die Risikoaversion von Menschen zu messen.

Einleitung

Bei Entscheidungen sehen sich Menschen, Organisationen und Algorithmen oft Unsicherheiten gegenüber, was in der Zukunft passieren könnte. Unterschiedliche Entscheidungsträger gewichten ihre Optionen je nach dieser Unsicherheit anders. Zum Beispiel könnte eine Person in einem sicheren Job mit einem stabilen Gehalt bleiben, während eine andere ein Risiko eingeht und zu einem Start-up mit ungewissen Ergebnissen wechselt. Diese unterschiedlichen Entscheidungen repräsentieren unterschiedliche Risikopräferenzen: Die erste Person ist risikoavers, während die zweite risikofreudig ist.

Die Risikoaversion zu quantifizieren ist wichtig, um zu analysieren, wie Menschen und Algorithmen Entscheidungen treffen. Die erwartete Nutzenfunktion ist eine gängige Möglichkeit, diese Unterschiede zu modellieren. Die Grundidee ist, dass jeder Agent eine interne Nutzenfunktion hat, die den Gesamtwert verschiedener Ergebnisse widerspiegelt. Wenn er zwischen bestimmten Ergebnissen wählt, wählt ein Agent das Ergebnis mit der höchsten Nutzenänderung. Wenn die Ergebnisse unsicher sind, berechnet der Agent eine wahrscheinliche gewichtete Summe möglicher Nutzenänderungen, um die Option auszuwählen, die den höchsten erwarteten Nutzen ergibt.

Wetten können in Experimenten verwendet werden, um die Risikoaversion zu untersuchen. In solchen Experimenten wählen Agenten zwischen Wetten, die unterschiedliche Risiken und Belohnungen bieten, und ihre Entscheidungen können Informationen über ihre zugrunde liegenden Risikopräferenzen enthüllen. Samuelsons Theorie der offenbarten Präferenzen unterstützt diese Idee und besagt, dass die wiederholten Entscheidungen eines Agenten Hinweise auf seine Risikoaversion geben können. Afriat hat gezeigt, dass es möglich ist, eine Nutzenfunktion zu erstellen, die mit dem beobachteten Verhalten aus einer begrenzten Datenstichprobe übereinstimmt.

In unserer Studie definieren wir zwei Arten von Wetten: additive und multiplikative. Bei additiven Wetten sind Gewinne und Verluste unabhängig vom aktuellen Vermögen des Agenten. Bei multiplikativen Wetten hängen diese Gewinne und Verluste vom aktuellen Vermögen ab. Diese Unterscheidung ist besonders relevant für wiederholte Wetten, bei denen Ergebnisse aus einer Entscheidung zukünftige Entscheidungen beeinflussen. Die Art und Weise, wie diese Wetten funktionieren, hat erhebliche Auswirkungen darauf, wie Risiken die Gesamtleistung im Laufe der Zeit beeinflussen.

Forschungen haben gezeigt, dass die optimale Strategie für additive im Vergleich zu multiplikativen Wetten unterschiedlich sein kann. In additiven Szenarien ist es am besten, Wetten zu wählen, die die erwarteten Vermögensänderungen maximieren. Im Gegensatz dazu sollten Agenten bei multiplikativen Wetten darauf abzielen, die erwartete Änderungsrate des Logarithmus ihres Vermögens zu maximieren. Folglich schneiden Agenten mit linearen Nutzenfunktionen in additiven Fällen am besten ab, während diejenigen mit logarithmischen Nutzenfunktionen in multiplikativen Szenarien besser abschneiden.

Um diese Dynamiken weiter zu untersuchen, schaffen wir eine Reihe von Wetten, die sanft zwischen additiven und multiplikativen Fällen übergehen. Dieser Ansatz gibt Kontext, um die Unterschiede zu verstehen und hilft zu bewerten, wie die Art der Wette unsere Fähigkeit beeinflusst, die Nutzenfunktionen von Agenten anhand ihrer Entscheidungen zu erschliessen. Wenn das Vermögen wächst, finden wir typischerweise, dass es schwieriger wird, Agenten mit unterschiedlichen Risikoaversionen zu unterscheiden, da sie schliesslich die gleichen Entscheidungen treffen werden.

Die Auswirkungen dieser Ergebnisse erstrecken sich auf reale Experimente, die darauf abzielen, die Risikoaversion effektiver zu messen.

Zeitoptimale Strategien für wiederholte Wetten

Eine Wette beinhaltet eine Handlung eines Agenten mit ungewissen Ergebnissen. Wir konzentrieren uns auf Situationen, in denen ein Agent wiederholt zwischen Wetten wählt, die Ergebnisse beobachtet und sieht, wie sich sein Vermögen im Laufe der Zeit ändert. Das Vermögen eines Agenten spiegelt die gesamten Belohnungen wider, die im Laufe des Experiments gewonnen wurden.

Eine wichtige Frage stellt sich: Wie vergleicht ein Agent verschiedene Wetten? Die Antwort hängt davon ab, was der Agent maximieren möchte. Unsere Agenten maximieren ihr Vermögen, aber es ist unmöglich, die Belohnungen aus einer einzigen Wette direkt zu maximieren, da Unsicherheiten bestehen. Stattdessen könnten sie die Wette mit der höchsten erwarteten Belohnung bevorzugen, was das durchschnittliche Ergebnis wäre, wenn die Wette viele Male gespielt würde.

Dieses Vorgehen kann jedoch irreführend sein, da Ereignisse mit niedriger Wahrscheinlichkeit und hohem Einfluss die erwartete Belohnung im Vergleich zu typischen Ergebnissen aufblähen könnten. Wenn die Grösse einer Wette vom Vermögen des Agenten abhängt, könnte die Wirkung eines glücklichen Ereignisses nicht signifikant sein, da die Wettgrösse abnehmen könnte, während das Vermögen zunimmt.

Eine alternative Methode besteht darin, das langfristige Wachstum zu maximieren, was eine andere Reihe von Berechnungen erfordert. Die Wachstumsrate für einen Prozess mit unabhängig und identisch verteilten Änderungen kann definiert werden. Diese Methode garantiert eine bessere Leistung über die Zeit und ermöglicht es einem Agenten, andere im Vermögen zu übertreffen. Diese Idee steht im Zusammenhang mit dem starken Gesetz der grossen Zahlen.

Anhand von Beispielen für additive und multiplikative Prozesse berechnen wir ihre Wachstumsraten. Bei additiven Prozessen ist der durchschnittliche Anstieg unabhängig vom aktuellen Vermögen, während sich bei multiplikativen Prozessen die Grösse des Anstiegs mit dem aktuellen Wert ändert.

Die Transformation des Prozesses in eine besser handhabbare Form ist eine bekannte Technik in der Zeitreihenanalyse. Das Ziel ist es, einen komplexen Prozess in einen mit wünschenswerteren Eigenschaften zu verwandeln. Bei multiplikativen Prozessen führt diese Transformation zu logarithmischen Funktionen, die einfachere Berechnungen ermöglichen.

Die Wahl der Maximierung der Wachstumsrate stellt eine zeitoptimale Strategie sicher. Ein zeitoptimierter Agent kann garantiert alle anderen im Vermögen übertreffen. Die Maximierung der Wachstumsrate wurde erheblich anerkannt und wurde bemerkenswerterweise als Kelly-Kriterium eingeführt, eine Methode zur Bestimmung der optimalen Wettgrösse.

Das Kelly-Kriterium schlägt vor, dass Agenten einen bestimmten Prozentsatz ihres Vermögens setzen können, um Renditen in Szenarien zu maximieren, in denen Wahrscheinlichkeiten bekannt sind. Es zeigt, dass die Maximierung des erwarteten Logarithmus der Renditen zur Zeitoptimalität führt, was mit den Prinzipien der Maximierung der Wachstumsrate übereinstimmt.

Yeo-Johnson-Wetten: Interpolation zwischen additiven und multiplikativen Wetten

Wir haben uns auf Agenten konzentriert, die mit streng additiven oder streng multiplikativen Prozessen umgehen. Durch den Einsatz einer Ergodizitäts-Transformation, die zwischen diesen beiden extremen Funktionen liegt, können wir jedoch vielseitigere Prozesse schaffen.

Dieses Konzept weist Ähnlichkeiten mit Box-Cox-Transformationen auf, die darauf abzielen, eine Funktion zu finden, die eine Zeitreihe am besten in einen idealen weissen Rauschprozess umwandelt. Die Yeo-Johnson-Transformation erfüllt unsere Anforderungen, da sie für eine Vielzahl von Parameterwahl keine Grenzen hat. Sie umfasst sowohl additive als auch multiplikative Prozesse.

Trotz ihrer Vorteile müssen wir sicherstellen, dass die gewählte Transformation zufälligen Prozessen ohne Einschränkungen gerecht wird. Glücklicherweise behält die Yeo-Johnson-Transformation wünschenswerte Eigenschaften bei, die einen sanften Übergang zwischen negativen und positiven Werten gewährleisten und komplexe oder undefinierte Ergebnisse vermeiden.

Praktisch ermöglicht uns diese Transformation, Prozesse zu kategorisieren, die irgendwo zwischen additiven und multiplikativen Dynamiken liegen, und erleichtert ein durchdachtes experimentelles Setup.

Entwurfsüberlegungen für Experimente zu offenbarten Präferenzen mit wiederholten Yeo-Johnson-Wetten

Unser Ziel ist es, ein Experiment zu entwerfen, um zeitoptimierte Agenten aus einer Gruppe von agenten, die den erwarteten Nutzen maximieren, zu identifizieren, wobei jeder einzigartige Nutzenfunktionen hat. Ein zeitoptimierter Agent sollte durch die Maximierung der Wachstumsraten im Laufe der Zeit besser im Vermögensaufbau abschneiden.

Je länger das Experiment läuft, desto wahrscheinlicher ist es, den wachstumsratenmaximierenden Agenten zu identifizieren. Dieses Design hat reale Implikationen für die Messung der Risikoaversion von Menschen.

In unserem Experiment betrachten wir eine Auswahl von erwartungsgemäss nutzmaximierenden Agenten, deren Funktionen auf der Yeo-Johnson-Transformation basieren. Bei jedem Zeitschritt wählen alle Agenten zwischen zwei Wetten, die ihr Vermögen beeinflussen.

Eine Wette ist eine sichere Option mit bekanntem Ergebnis, wie das Anlegen von Geld auf einem Bankkonto. Die andere Wette ist riskant und wird mit einer Normalverteilung modelliert. Die Herausforderung besteht darin, sicherzustellen, dass das Vermögen nicht zu weit von null abweicht, um eine Entscheidungs-Konvergenz zu vermeiden, bei der verschiedene Agenten möglicherweise dieselben Wege wählen, während ihr Vermögen wächst.

Nutzenberechnung

Agenten im Experiment entscheiden auf Grundlage der erwarteten Änderung des Nutzens für jede Wette. Für die sichere Option spiegelt die erwartete Änderung direkt die Nutzenänderung wider. Im Gegensatz dazu ist es komplexer, dies für die riskante Option zu berechnen, da das Wachstum des Vermögens nicht-linear ist.

Indem wir die Verteilung des Nutzens für die riskante Option bestimmen, können wir numerische Methoden verwenden, um die erwartete Änderung zu schätzen.

Bedingungen für die Entscheidungs-Konvergenz

Die Entscheidungs-Konvergenz tritt auf, wenn die Entscheidungen der Agenten beginnen, sich anzugleichen, während ihr Vermögen wächst. Bei bestimmten Nutzenfunktionen werden die Agenten beginnen, sich ähnlich zu verhalten, wenn das Vermögen von null abweicht.

In Fällen, in denen keine Entscheidungs-Konvergenz auftritt, zeigen Agenten unterschiedliche Präferenzen, was es einfacher macht, ihre Risikoaversion zu unterscheiden.

Ergebnisse der numerischen Experimente

Wir werden die Ergebnisse des entworfenen Experiments demonstrieren und zeigen, dass Agenten mit unterschiedlichen Risikoaversionen im Laufe der Zeit tatsächlich unterschieden werden können. Wir werden das Verhalten von Agenten mit unterschiedlichen Risikoaversionen verfolgen, insbesondere von denen, die Yeo-Johnson-Transformationen verwenden.

Unsere numerischen Experimente, die zahlreiche Male durchgeführt wurden, offenbaren aufschlussreiche Muster. Wir werden die Verteilungen des Vermögens unter diesen Agenten analysieren und sehen, wie sich ihre Strategien im Verlauf des Experiments auswirken.

Diskussion und Fazit

In diesem Artikel haben wir untersucht, wie man die Risikoaversion unter verschiedenen Agenten durch numerische Experimente identifizieren kann. Wir haben uns angeschaut, wie Agenten wiederholt zwischen sicheren und riskanten Optionen wählen und wie diese Entscheidungen ihr Gesamtvermögen beeinflussen.

Wir standen Herausforderungen gegenüber, wie Ergebnisse das Vermögen beeinflussen konnten. Unsere Lösung bestand darin, die Yeo-Johnson-Transformation aufgrund ihrer vorteilhaften Eigenschaften zu verwenden. Ausserdem haben wir uns mit den Problemen der Entscheidungs-Konvergenz beschäftigt, die die Fähigkeit zur Unterscheidung von Risikoaversion erschweren könnten.

Unsere Erkenntnisse aus den numerischen Experimenten bestätigten, dass Agenten, die die Wachstumsrate maximieren, tatsächlich besser abschneiden als ihre Gegenstücke. Diese Arbeit hat Auswirkungen auf die Gestaltung besserer Experimente zur Einschätzung der Risikoaversion von Menschen und eröffnet neue Wege für weitere Erkundungen in diesem Bereich.

Originalquelle

Titel: Distinguishing Risk Preferences using Repeated Gambles

Zusammenfassung: Sequences of repeated gambles provide an experimental tool to characterize the risk preferences of humans or artificial decision-making agents. The difficulty of this inference depends on factors including the details of the gambles offered and the number of iterations of the game played. In this paper we explore in detail the practical challenges of inferring risk preferences from the observed choices of artificial agents who are presented with finite sequences of repeated gambles. We are motivated by the fact that the strategy to maximize long-run wealth for sequences of repeated additive gambles (where gains and losses are independent of current wealth) is different to the strategy for repeated multiplicative gambles (where gains and losses are proportional to current wealth.) Accurate measurement of risk preferences would be needed to tell whether an agent is employing the optimal strategy or not. To generalize the types of gambles our agents face we use the Yeo-Johnson transformation, a tool borrowed from feature engineering for time series analysis, to construct a family of gambles that interpolates smoothly between the additive and multiplicative cases. We then analyze the optimal strategy for this family, both analytically and numerically. We find that it becomes increasingly difficult to distinguish the risk preferences of agents as their wealth increases. This is because agents with different risk preferences eventually make the same decisions for sufficiently high wealth. We believe that these findings are informative for the effective design of experiments to measure risk preferences in humans.

Autoren: James Price, Colm Connaughton

Letzte Aktualisierung: 2023-08-14 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2308.07054

Quell-PDF: https://arxiv.org/pdf/2308.07054

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel