Aktienkurse mit Sprachmodellen vorhersagen
Sprachmodelle nutzen, um Aktienkursbewegungen durch Finanz- und Nachrichtendaten vorherzusagen.
― 5 min Lesedauer
Inhaltsverzeichnis
Die Vorhersage von Aktienkursen ist wie das Raten, ob deine Katze ein Glas Wasser umschmeisst. Man muss viele Faktoren berücksichtigen, von der finanziellen Leistung eines Unternehmens bis hin zu dem, was die Leute in den sozialen Medien sagen. Wenn du Finanzberichte, vergangene Aktienkurse und aktuelle Nachrichtenartikel kombinierst, kannst du ein ziemlich gutes Bild davon bekommen, was als Nächstes passieren könnte.
Verschiedene Datenarten kombinieren
Um unsere Aktienvorhersagen zu treffen, müssen wir Informationen aus mehreren Quellen zusammenführen. Dazu gehören:
Finanzdaten: Das sind die grundlegenden Sachen wie Gewinn- und Verlustrechnung und Bilanzen. Jedes börsennotierte Unternehmen in den USA muss diese Informationen vierteljährlich veröffentlichen. Ist wie das Vorzeigen deines Zeugnis bei deinen Eltern.
Historische Preisdaten: Hier schauen wir uns an, wie sich eine Aktie in der Vergangenheit entwickelt hat. Wenn der Aktienkurs eines Unternehmens wie eine Achterbahn rauf und runter geht, kann das Hinweise darauf geben, was in Zukunft passieren könnte.
Nachrichtenartikel: Investoren achten oft genau auf Nachrichten. Soziale Medien und Nachrichtenberichte sind wie das Klatsch der Börse; sie können beeinflussen, wie die Leute über ein Unternehmen denken.
Nutzung von Sprachmodellen
Wir haben uns entschieden, eine coole Technologie namens grosse Sprachmodelle (LLMs) zu nutzen, um Vorhersagen zu treffen. Diese Modelle sind wie sehr schlauere Roboter, die Texte lesen und verstehen können. Sie können sowohl strukturierte Daten (wie Zahlen) als auch unstrukturierte Daten (wie Nachrichtenartikel) verarbeiten. Indem wir dem Modell Finanzdaten und relevante Nachrichtenartikel füttern, fordern wir es auf, vorherzusagen, ob der Aktienkurs steigen oder fallen könnte.
Für unsere Experimente haben wir verschiedene Arten von LLMs verwendet, darunter GPT-3, GPT-4 und LLaMA-Versionen. Diese Modelle haben gezeigt, dass sie beide Datenarten effektiv klassifizieren können.
So haben wir es gemacht
Wir haben eine Menge Nachrichtenartikel und Finanzberichte für 20 börsennotierte Unternehmen gesammelt. Diese wurden aufgrund der Häufigkeit, mit der ihre Aktien gehandelt werden, ausgewählt. Dann haben wir einen Datensatz erstellt, der folgendes enthielt:
- 5.000 Nachrichtenartikel über diese Unternehmen von Oktober 2021 bis Januar 2024.
- Finanzdaten aus den 10-K-Berichten der Unternehmen, die verschiedene Finanzkennzahlen enthalten.
Wir haben eine Methode namens "Retrieval Augmentation" verwendet, um die relevantesten Nachrichtenartikel zu finden und sie mit den Finanzdaten des Unternehmens zu verknüpfen. So hatten unsere Modelle, wenn wir sie nach der Vorhersage von Aktienkursbewegungen fragten, den nötigen Kontext.
Zusammenfassen von Nachrichtenartikeln
Bei all den Nachrichten da draussen mussten wir herausfinden, wie wir sie zusammenfassen können. Wir haben ein paar Methoden angewendet:
Extraktive Zusammenfassung: Diese Methode pickt wichtige Sätze aus einem Artikel heraus. So wie die besten Zitate aus einem Film zu finden, ohne den ganzen Film anzuschauen.
Abstraktive Zusammenfassung: Diese Technik generiert neue Sätze, die das Wesentliche der Artikel erfassen. Stell dir vor, jemand fasst einen zwei Stunden langen Film in einem Satz zusammen.
Durch die Verwendung dieser Zusammenfassungsmethoden konnten wir uns auf die Teile der Nachrichten konzentrieren, die die Aktienkurse am meisten beeinflussten.
Prompts für Vorhersagen erstellen
Als wir Informationen in unsere LLMs eingepflegt haben, mussten wir darauf achten, wie wir unsere Prompts strukturiert haben. Denke an Prompts als Fragen, die du stellst, um eine Antwort zu bekommen. Wir haben mit verschiedenen Arten experimentiert, die Informationen zu organisieren, da die Reihenfolge wirklich einen Einfluss darauf hat, wie gut das Modell funktioniert. Wir haben Abschnitte über das Unternehmen, die aktuellen Nachrichten, die Finanzdaten und dann unsere Hauptfrage eingefügt: "Soll ich in dieses Unternehmen investieren?"
Unsere Vorhersagen testen
Um zu sehen, wie gut unsere Modelle abschnitten, haben wir einen Satz von Beispiel-Prompts vorbereitet. Wir haben unsere Modelle unter verschiedenen Einstellungen getestet - Zero-Shot, Two-Shot und Four-Shot - um herauszufinden, welche am besten funktionierte.
- Zero-Shot-Einstellung: Wir haben das Modell einfach die Frage gestellt, ohne vorherige Beispiele.
- Two-Shot-Einstellung: Wir haben zwei Beispiele bereitgestellt.
- Four-Shot-Einstellung: Wir haben vier Beispiele bereitgestellt.
Überraschenderweise führte das Hinzufügen von mehr Beispielen nicht immer zu besserer Genauigkeit. Es war wie der Versuch, einem alten Hund neue Tricks beizubringen - das funktioniert nicht immer!
Ergebnisse und Erkenntnisse
Unsere Forschung hat gezeigt, dass verschiedene Modelle unterschiedlich abgeschnitten haben. Einige Modelle wie GPT-4 und LLaMA3 waren besser darin, die Bewegungen der Aktienkurse vorherzusagen. Die besten Ergebnisse kamen von Modellen, die beide Datenarten - finanzielle Zahlen und Nachrichten-Snippets - ausbalancieren konnten.
Warum es wichtig ist
Warum sollte es also jemanden interessieren, diese Vorhersagen zu kennen? Nun, zu wissen, ob der Preis einer Aktie steigen oder fallen könnte, kann Investoren helfen, bessere Entscheidungen zu treffen. Wenn ein Modell diese Bewegungen genau vorhersagen kann, könnte es Menschen davor bewahren, schlechte Anlageentscheidungen zu treffen - wie den Kauf einer Aktie kurz bevor sie abstürzt.
Zukünftige Richtungen
Wir haben gelernt, dass es vielversprechend ist, grosse Sprachmodelle auf diese Weise zu nutzen, es aber noch viel zu verbessern gibt. Für unsere nächsten Schritte planen wir, kleinere Modelle zu verfeinern, die sowohl textuelle als auch numerische Daten kombinieren. Wir sind auch daran interessiert, unseren Ansatz von einfachen Vorhersagen, ob die Aktie steigen oder fallen wird, zu ändern, hin zu Vorhersagen, wie viel sie sich prozentual ändern könnte. Aktien sind ein kompliziertes Geschäft, aber wir sind gespannt darauf, weiter zu lernen!
Fazit
Am Ende ist die Vorhersage von Aktienkursen eine komplexe, aber spannende Herausforderung. Mit der richtigen Mischung aus Finanzdaten, Nachrichtenartikeln und intelligenter Technologie können wir unsere Chancen verbessern, genaue Vorhersagen zu treffen. Und wer weiss? Vielleicht gibt es eines Tages eine Katze, die kein Wasser mehr umwirft!
Titel: Combining Financial Data and News Articles for Stock Price Movement Prediction Using Large Language Models
Zusammenfassung: Predicting financial markets and stock price movements requires analyzing a company's performance, historic price movements, industry-specific events alongside the influence of human factors such as social media and press coverage. We assume that financial reports (such as income statements, balance sheets, and cash flow statements), historical price data, and recent news articles can collectively represent aforementioned factors. We combine financial data in tabular format with textual news articles and employ pre-trained Large Language Models (LLMs) to predict market movements. Recent research in LLMs has demonstrated that they are able to perform both tabular and text classification tasks, making them our primary model to classify the multi-modal data. We utilize retrieval augmentation techniques to retrieve and attach relevant chunks of news articles to financial metrics related to a company and prompt the LLMs in zero, two, and four-shot settings. Our dataset contains news articles collected from different sources, historic stock price, and financial report data for 20 companies with the highest trading volume across different industries in the stock market. We utilized recently released language models for our LLM-based classifier, including GPT- 3 and 4, and LLaMA- 2 and 3 models. We introduce an LLM-based classifier capable of performing classification tasks using combination of tabular (structured) and textual (unstructured) data. By using this model, we predicted the movement of a given stock's price in our dataset with a weighted F1-score of 58.5% and 59.1% and Matthews Correlation Coefficient of 0.175 for both 3-month and 6-month periods.
Autoren: Ali Elahi, Fatemeh Taghvaei
Letzte Aktualisierung: 2024-11-02 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2411.01368
Quell-PDF: https://arxiv.org/pdf/2411.01368
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.