Simple Science

Scienza all'avanguardia spiegata semplicemente

# Finanza quantitativa # Recupero delle informazioni # Finanza computazionale

Prevedere i prezzi delle azioni con i modelli di linguaggio

Usare modelli di linguaggio per prevedere i movimenti dei prezzi delle azioni tramite dati finanziari e notizie.

Ali Elahi, Fatemeh Taghvaei

― 5 leggere min


Insights sulla previsione Insights sulla previsione dei prezzi delle azioni modelli linguistici. Valutare i prezzi delle azioni usando
Indice

Prevedere i prezzi delle azioni è come indovinare se il tuo gatto rovescerà un bicchiere d'acqua. Bisogna considerare un sacco di fattori, dalle performance finanziarie di un'azienda a ciò che la gente dice sui social media. Se combini rapporti finanziari, prezzi delle azioni passate e articoli di attualità, puoi farti un'idea piuttosto chiara di cosa potrebbe succedere dopo.

Combinare Diversi Tipi di Dati

Per fare le nostre previsioni sulle azioni, dobbiamo raccogliere informazioni da più fonti. Questo include:

  • Dati Finanziari: Qui parliamo di cose come i bilanci e i conti economici. Ogni azienda pubblica negli Stati Uniti deve condividere queste informazioni ogni trimestre. È come mostrare il tuo pagellino ai tuoi genitori.

  • Dati storici sui prezzi: Questo riguarda come si è comportata un'azione nel passato. Se il prezzo di un'azione è salito e sceso come una montagne russe, potrebbe darci indizi su cosa potrebbe succedere in futuro.

  • Articoli di Notizie: Gli investitori prestano molta attenzione alle notizie. I social media e le notizie sono come il pettegolezzo del mercato azionario; possono influenzare come la gente si sente riguardo a un'azienda.

Usare i Modelli Linguistici

Abbiamo deciso di usare una tecnologia avanzata chiamata Modelli Linguistici di Grandi Dimensioni (LLMs) per aiutarci a fare previsioni. Questi modelli sono come robot molto intelligenti che possono leggere e capire i testi. Possono gestire sia dati strutturati (come i numeri) che dati non strutturati (come gli articoli di notizie). Nutrendo il modello con dati finanziari e articoli di notizie pertinenti, lo stimoliamo a prevedere se il prezzo di un'azione potrebbe salire o scendere.

Per i nostri esperimenti, abbiamo utilizzato diversi tipi di LLM, inclusi GPT-3, GPT-4 e versioni di LLaMA. Questi modelli hanno dimostrato di poter classificare efficacemente entrambi i tipi di dati.

Come Abbiamo Fatto

Abbiamo raccolto una serie di articoli di notizie e rapporti finanziari per 20 aziende quotate in borsa. Queste sono state scelte in base a quanto spesso vengono scambiate le loro azioni. Abbiamo poi creato un dataset che includeva:

  • 5.000 articoli di notizie che coprivano queste aziende da ottobre 2021 a gennaio 2024.
  • Dati finanziari dai rapporti 10-K delle aziende, che includono vari indicatori finanziari.

Abbiamo usato un metodo chiamato "augmentation del recupero" per trovare gli articoli di notizie più rilevanti e attaccarli ai dati finanziari dell'azienda. In questo modo, quando abbiamo chiesto ai nostri modelli di prevedere le variazioni dei prezzi delle azioni, avevano tutto il contesto necessario.

Riassumere gli Articoli di Notizie

Con tanta notizia in giro, abbiamo dovuto capire come riassumerla. Abbiamo impiegato un paio di metodi:

  1. Riassunto Estraente: Questo metodo seleziona frasi importanti da un articolo. È come trovare le migliori citazioni da un film senza guardarlo tutto.

  2. Riassunto Astrattivo: Questa tecnica genera nuove frasi che catturano l'essenza degli articoli. Immagina qualcuno che riassume un film di due ore in una sola frase.

Utilizzando queste tecniche di riassunto, potevamo concentrarci sulle parti delle notizie che influenzavano di più i prezzi delle azioni.

Creare Prompt per le Previsioni

Quando abbiamo alimentato informazioni nei nostri LLM, dovevamo stare attenti a come strutturavamo i nostri prompt. Pensa ai prompt come a domande che fai per ottenere una risposta. Abbiamo sperimentato diversi modi di organizzare le informazioni che fornivamo, dato che l'ordine può davvero influire su quanto bene il modello funzioni. Abbiamo incluso sezioni riguardanti l'azienda, le sue ultime notizie, i suoi dati finanziari e poi abbiamo posto la nostra domanda principale: "Dovrei investire in questa azienda?"

Testare le Nostre Previsioni

Per vedere quanto bene hanno funzionato i nostri modelli, abbiamo preparato un set di prompt di esempio. Abbiamo testato i nostri modelli in diverse impostazioni: zero-shot, two-shot e four-shot per vedere quale funzionava meglio.

  • Impostazione zero-shot: Abbiamo semplicemente posto la domanda al modello senza esempi precedenti.
  • Impostazione two-shot: Abbiamo fornito due esempi.
  • Impostazione four-shot: Abbiamo fornito quattro esempi.

Sorprendentemente, aggiungere più esempi non ha sempre portato a una maggiore accuratezza. Era come cercare di insegnare a un cane anziano nuovi trucchi-non sempre funziona!

Risultati e Scoperte

La nostra ricerca ha mostrato che diversi modelli hanno performato in modo diverso. Alcuni modelli come GPT-4 e LLaMA3 erano migliori nel prevedere i movimenti dei prezzi delle azioni. I migliori risultati sono venuti da modelli che riuscivano a bilanciare entrambi i tipi di dati-numeri finanziari e ritagli di notizie.

Perché È Importante

Quindi perché dovrebbe importare a qualcuno di queste previsioni? Beh, sapere se il prezzo di un'azione potrebbe salire o scendere può aiutare gli investitori a prendere decisioni migliori. Se un modello può prevedere accuratamente questi movimenti, potrebbe salvare le persone dal fare scelte d'investimento sbagliate-come comprare un'azione proprio prima che crolli.

Direzioni Future

Abbiamo imparato che mentre usare modelli di linguaggio grandi in questo modo è promettente, c’è ancora molto da migliorare. Per i nostri prossimi passi, pianifichiamo di ottimizzare modelli più piccoli che combinano sia dati testuali che numerici. Siamo anche interessati a cambiare il nostro approccio da semplici previsioni su se l'azione salirà o scenderà a prevedere quanto potrebbe cambiare in termini percentuali. Le azioni sono un affare complicato, ma siamo desiderosi di continuare a imparare!

Conclusione

Alla fine, prevedere i prezzi delle azioni è una sfida complessa ma affascinante. Con il giusto mix di dati finanziari, articoli di notizie e tecnologia intelligente, possiamo migliorare le nostre possibilità di fare previsioni accurate. E chissà? Magari un giorno ci sarà un gatto che non rovescia bicchieri d'acqua!

Fonte originale

Titolo: Combining Financial Data and News Articles for Stock Price Movement Prediction Using Large Language Models

Estratto: Predicting financial markets and stock price movements requires analyzing a company's performance, historic price movements, industry-specific events alongside the influence of human factors such as social media and press coverage. We assume that financial reports (such as income statements, balance sheets, and cash flow statements), historical price data, and recent news articles can collectively represent aforementioned factors. We combine financial data in tabular format with textual news articles and employ pre-trained Large Language Models (LLMs) to predict market movements. Recent research in LLMs has demonstrated that they are able to perform both tabular and text classification tasks, making them our primary model to classify the multi-modal data. We utilize retrieval augmentation techniques to retrieve and attach relevant chunks of news articles to financial metrics related to a company and prompt the LLMs in zero, two, and four-shot settings. Our dataset contains news articles collected from different sources, historic stock price, and financial report data for 20 companies with the highest trading volume across different industries in the stock market. We utilized recently released language models for our LLM-based classifier, including GPT- 3 and 4, and LLaMA- 2 and 3 models. We introduce an LLM-based classifier capable of performing classification tasks using combination of tabular (structured) and textual (unstructured) data. By using this model, we predicted the movement of a given stock's price in our dataset with a weighted F1-score of 58.5% and 59.1% and Matthews Correlation Coefficient of 0.175 for both 3-month and 6-month periods.

Autori: Ali Elahi, Fatemeh Taghvaei

Ultimo aggiornamento: 2024-11-02 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2411.01368

Fonte PDF: https://arxiv.org/pdf/2411.01368

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili