Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Quantitatives Finanzwesen# Allgemeine Wirtschaftswissenschaften# Künstliche Intelligenz# Wirtschaftswissenschaften

KI sagt Ereignisse voraus: Direkte Fragen vs. Geschichtenerzählen

Eine Studie zeigt, wie Erzählanreize die KI-Vorhersagen im Vergleich zu direkten Fragen verbessern.

― 6 min Lesedauer


KI sagt voraus:KI sagt voraus:Storytelling gewinntverbessern.die Vorhersagen von KI-Events deutlichEine Studie zeigt, dass Erzählanreize
Inhaltsverzeichnis

Künstliche Intelligenz (KI) verändert schnell, wie wir verschiedene Aufgaben sehen, einschliesslich Vorhersagen. Ein interessantes Thema ist, ob KI zukünftige Ereignisse genau vorhersagen kann, insbesondere bei wichtigen Ereignissen wie den Academy Awards oder wirtschaftlichen Trends. Dieser Artikel untersucht das Potenzial eines bestimmten KI-Modells namens ChatGPT, speziell die Versionen 3.5 und 4, um Ereignisse vorherzusagen, die nach dem letzten Update stattgefunden haben.

Hintergrund zu ChatGPT

ChatGPT ist ein Produkt von OpenAI und basiert auf einer Struktur, die als Transformer bekannt ist. Dieses Transformer-Modell kann Sprache verstehen und Antworten generieren, die natürlich klingen. ChatGPT wurde mit einer beträchtlichen Menge an Text aus dem Internet, Büchern und Artikeln trainiert, sodass es ein breites Spektrum an Themen und Kontexten begreifen kann. Allerdings endet das Trainingsmaterial im September 2021, was bedeutet, dass es nichts über Ereignisse nach diesem Datum weiss. Diese Einschränkung ist wichtig, um zu verstehen, wie gut es spätere Ereignisse vorhersagen kann.

Die Grundidee

Diese Studie untersucht, ob ChatGPT genaue Vorhersagen über Ereignisse treffen kann, die 2022 stattgefunden haben. Die Forscher konzentrierten sich auf zwei unterschiedliche Methoden, um die KI nach diesen Vorhersagen zu fragen: direkte Fragen und Erzählaufforderungen. Durch den Vergleich beider Ansätze wollten sie herausfinden, welche Methode zu besseren Vorhersagen führt.

Direkte Frage vs. Erzählaufforderung

  1. Direkte Fragen: Diese Methode fragt ChatGPT direkt nach spezifischen zukünftigen Ereignissen. Zum Beispiel könnte man fragen: "Wer wird Bester Schauspieler bei den Oscars 2022?" Dieser Ansatz ist typisch, könnte aber die Stärken des Modells nicht effektiv nutzen.

  2. Erzählaufforderungen: Diese Methode besteht darin, ChatGPT zu bitten, eine fiktive Geschichte zu erzählen, die in der Zukunft spielt, in der die Ereignisse bereits passiert sind. Es könnte so etwas sein wie: "Erzähle eine Geschichte über eine Familie, die die Oscars schaut, und enthülle, wer Bester Schauspieler wurde." Dieser Stil regt die KI dazu an, kreativer zu werden und anders aus ihren Trainingsdaten zu schöpfen.

Testen der Vorhersagen

Um zu sehen, wie gut ChatGPT unter diesen beiden Methoden abgeschnitten hat, testeten die Forscher sowohl ChatGPT-3.5 als auch ChatGPT-4. Sie schauten sich verschiedene Ereignisse an, die 2022 stattfanden, wobei der Fokus auf zwei Hauptbereichen lag: den Academy Awards und wirtschaftlichen Indikatoren wie Arbeitslosenraten und Inflationsraten.

Die Academy Awards

Die Forscher verwendeten sowohl direkte als auch erzählerische Aufforderungen, um zu sehen, welche Methode ChatGPT nutzen würde, um die Gewinner der wichtigsten Filmpreise 2022 vorherzusagen. Sie schauten sich speziell Kategorien wie Bester Schauspieler, Beste Schauspielerin und Bester Film an.

  1. Bester Nebendarsteller: Der echte Gewinner war Troy Kotsur. Bei direkter Nachfrage sagte ChatGPT-3.5 nur in 1 % der Fälle richtig voraus und weigerte sich oft zu antworten. Im Gegensatz dazu verbesserten sich die Vorhersagen beim Einsatz von Erzählungen erheblich, insbesondere mit ChatGPT-4, das Kotsur jedes Mal korrekt vorhersagte.

  2. Bester Schauspieler: Der Gewinner war Will Smith. ChatGPT-3.5 lag bei direkten Fragen in etwa 17 % der Fälle richtig. Interessanterweise hatte es bei Erzählaufforderungen eine Trefferquote von 80 %. ChatGPT-4 zeigte sogar noch bessere Leistungen und sagte Smiths Sieg in 97 % der Fälle voraus.

  3. Beste Nebendarstellerin: Ariana DeBose war die Gewinnerin. Während ChatGPT-3.5 sie bei direkten Fragen in 34 % der Fälle richtig vorhersagte, verbesserte sich das auf 73 % mit Erzählaufforderungen. ChatGPT-4 war sogar besser und sagte DeBose’ Sieg in 99 % der Fälle voraus.

  4. Beste Schauspielerin: Jessica Chastain gewann den Preis. ChatGPT-3.5 hatte bei direkten Fragen Schwierigkeiten und sagte sie nur in 13 % der Fälle voraus, während Erzählungen diese Quote auf 42 % verbesserten. ChatGPT-4 war auch besser als 40 %, konnte aber Chastains Sieg nicht effektiv vorhersagen.

  5. Bester Film: Der Gewinnerfilm war Coda. Keines der Modelle identifizierte diesen Film vorhersehbar, wobei ChatGPT-3.5 ihn in keinem der beiden Fragetypen auswählte. ChatGPT-4 schnitt mit Coda etwas besser ab, konnte es aber trotzdem in den meisten Fällen nicht vorhersagen.

Wirtschaftliche Vorhersagen

Im nächsten Teil der Studie betrachteten die Forscher wirtschaftliche Indikatoren. Sie wollten sehen, ob ChatGPT die Arbeitslosen- und Inflationsraten für die Monate vor September 2022 genau vorhersagen konnte.

  1. Arbeitslosenraten: Direkte Fragen führten zu keinen Vorhersagen. Als sie jedoch gebeten wurden, eine Geschichte über einen Ökonomen zu erzählen, der über Arbeitslosenraten spricht, hatte ChatGPT-3.5 Schwierigkeiten, während ChatGPT-4 besser abschnitt, aber trotzdem nicht alle Zielraten genau traf.

  2. Inflationsraten: Ähnlich wie bei den Arbeitslosenraten brachten direkte Fragen keine Vorhersagen. Als es durch Erzählaufforderungen mit einem Ökonomen erzählt wurde, lieferte ChatGPT-3.5 unbefriedigende Ergebnisse. ChatGPT-4 hatte eine engere Verteilung der Antworten, konnte jedoch im Laufe des Jahres dennoch nicht mit hoher Genauigkeit vorhersagen.

Wie das Geschichtenerzählen half

Die Ergebnisse zeigten einen klaren Trend: Erzählaufforderungen bieten einen bedeutenden Vorteil gegenüber direkten Fragen. Das könnte daran liegen, wie die zugrunde liegende Struktur der KI ihre Sprachgenerierungsfähigkeiten kreativ nutzt, wenn sie Geschichten erstellt. Indem Vorhersagen in einen Erzählrahmen eingebettet werden, kann die KI ihre Trainingsdaten effektiver nutzen, was zu besseren Ergebnissen führt.

Warum ist das wichtig?

Die Ergebnisse deuten darauf hin, dass grosse Sprachmodelle wie ChatGPT potenziell nützlich für Vorhersageaufgaben sein können, insbesondere auf kreative Weise. Das ist nicht nur für Unterhaltung wichtig, wie das Vorhersagen von Preisgewinnern, sondern auch für ernsthafte Anwendungen wie wirtschaftliche Prognosen. Während die Gesellschaft weiterhin die Fähigkeiten von KI erkundet, könnte das Verständnis, wie man mit Modellen durch durchdachtes Fragen interagiert, über die Zeit zu einer besseren Nutzung führen.

Zukünftige Überlegungen

Mit der Weiterentwicklung der KI-Technologien kann die Bedeutung des Designens von Aufforderungen nicht genug betont werden. Die Art und Weise, wie wir Fragen stellen, kann die Antworten, die wir erhalten, erheblich beeinflussen. Forscher schlagen vor, dass diese Methode auch auf andere Bereiche ausgeweitet werden könnte, in denen Vorhersagen wichtig sind, wie Wettervorhersagen, Aktienmarktprognosen und sogar öffentliche Gesundheit.

Darüber hinaus hebt es eine spezifische Herausforderung hervor, die ethische Nutzung von KI sicherzustellen. Während Erzählaufforderungen vielversprechend sind, bringen sie auch Risiken von Missverständnissen mit sich, insbesondere wenn Menschen anfangen, sich auf KI-Vorhersagen für wichtige Entscheidungen zu verlassen, ohne den notwendigen Kontext oder Experteninput.

Fazit

ChatGPT kann Ereignisse besser vorhersagen, wenn es gebeten wird, Geschichten zu erzählen, anstatt direkte Vorhersagen zu geben. Dieser Ansatz nutzt nicht nur das kreative Potenzial der KI, sondern zeigt auch ihre bestehende Wissensbasis effektiver auf. Während KI weiterhin entwickelt wird, könnte das Verständnis, wie man diese Systeme durch innovative Aufforderungen nutzen kann, in verschiedenen Bereichen noch grössere Fähigkeiten freisetzen.

Indem die verborgenen Stärken grosser Sprachmodelle bei Vorhersageaufgaben aufgedeckt werden, öffnet diese Studie Türen für ihre zukünftigen Anwendungen. Während wir weiterhin mit KI interagieren, ist es wichtig, darauf zu achten, wie wir unsere Fragen formulieren und was wir von diesen leistungsstarken Werkzeugen erwarten.

Originalquelle

Titel: Can Base ChatGPT be Used for Forecasting without Additional Optimization?

Zusammenfassung: This study investigates whether OpenAI's ChatGPT-3.5 and ChatGPT-4 can forecast future events. To evaluate the accuracy of the predictions, we take advantage of the fact that the training data at the time of our experiments (mid 2023) stopped at September 2021, and ask about events that happened in 2022. We employed two prompting strategies: direct prediction and what we call future narratives which ask ChatGPT to tell fictional stories set in the future with characters retelling events that happened in the past, but after ChatGPT's training data had been collected. We prompted ChatGPT to engage in storytelling, particularly within economic contexts. After analyzing 100 trials, we find that future narrative prompts significantly enhanced ChatGPT-4's forecasting accuracy. This was especially evident in its predictions of major Academy Award winners as well as economic trends, the latter inferred from scenarios where the model impersonated public figures like the Federal Reserve Chair, Jerome Powell. As a falsification exercise, we repeated our experiments in May 2024 at which time the models included more recent training data. ChatGPT-4's accuracy significantly improved when the training window included the events being prompted for, achieving 100% accuracy in many instances. The poorer accuracy for events outside of the training window suggests that in the 2023 prediction experiments, ChatGPT-4 was forming predictions based solely on its training data. Narrative prompting also consistently outperformed direct prompting. These findings indicate that narrative prompts leverage the models' capacity for hallucinatory narrative construction, facilitating more effective data synthesis and extrapolation than straightforward predictions. Our research reveals new aspects of LLMs' predictive capabilities and suggests potential future applications in analytical contexts.

Autoren: Van Pham, Scott Cunningham

Letzte Aktualisierung: 2024-07-04 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2404.07396

Quell-PDF: https://arxiv.org/pdf/2404.07396

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Ähnliche Artikel