Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Calcolo e linguaggio

Analizzare i rapporti aziendali: le parole contano di più

Questo studio collega l'analisi delle parole nei report alle performance ESG.

― 8 leggere min


Parole vs. Numeri neiParole vs. Numeri neiReportreport per ottenere informazioni ESG.Nuovi metodi analizzano i testi dei
Indice

Quando si guarda a come si comportano le aziende, gli esperti hanno cominciato a prestare più attenzione alle parole che usano nei loro rapporti, non solo ai numeri. Queste parole possono dare indizi che aiutano a capire come sta andando un'azienda e come potrebbe andare in futuro. Questo cambiamento di focus permette a investitori e analisti di raccogliere più informazioni oltre ai dati finanziari.

In questo contesto, questo lavoro si concentra sull'uso di metodi di Apprendimento multi-task per analizzare il testo nei rapporti annuali. Guardiamo a vari aspetti del contenuto, come i Sentimenti espressi nel testo, la sua obiettività, se guarda avanti a eventi futuri e come si relaziona ai criteri Ambientali, Sociali e di Governance (ESG).

L'approccio migliore che abbiamo trovato combina i risultati di più compiti per migliorare l'analisi complessiva. Utilizzando questi classificatori, abbiamo analizzato i rapporti annuali delle aziende nell'indice FTSE350. Abbiamo anche cercato connessioni tra le caratteristiche qualitative derivate dal testo e i punteggi ESG numerici forniti dagli analisti finanziari.

Spostamento nell'Analisi da Numeri a Parole

C'è stata una crescente consapevolezza che le parole usate nei rapporti possono essere altrettanto importanti, se non di più, delle cifre finanziarie. Tradizionalmente, gli analisti lavoravano con queste informazioni manualmente, ma il volume enorme di dati testuali negli ultimi anni ha reso questo approccio impraticabile.

I dati testuali sulle aziende provengono da tre fonti principali: divulgazioni richieste al pubblico, articoli di notizie e social media. Tuttavia, i rapporti aziendali ricevono un'attenzione speciale perché vengono pubblicati periodicamente e sono regolamentati per garantire che le aziende forniscano informazioni dettagliate sulla loro situazione finanziaria.

Questi rapporti contengono non solo numeri ma anche ricchi dati testuali che possono fornire informazioni sull'azienda e sul suo futuro. Ad esempio, la scelta delle parole e il tono possono rivelare molto sulla situazione di un'azienda che i numeri da soli non possono mostrare.

Sfide nell'Analizzare l'Informazione Testuale

Estrarre e elaborare informazioni qualitative dai rapporti finanziari è più complicato rispetto ai dati numerici. I ricercatori stanno ora guardando non solo al contenuto dei rapporti ma anche alle loro caratteristiche stilistiche. Ad esempio, capire il sentiment o l'obiettività in questi rapporti può fornire indizi su come gli investitori potrebbero reagire al titolo di un'azienda.

In questo studio, ci concentriamo su tre indicatori stilistici principali: sentiment (sentimenti positivi o negativi), obiettività (fatto contro opinione) e dichiarazioni avventurose (previsioni sul futuro). Inoltre, esploriamo quanto bene queste caratteristiche si relazionano ai temi ESG. L'ESG riguarda il comportamento delle aziende nei confronti della società e dell'ambiente mentre cercano comunque di fare profitti.

Investitori e regolatori sono sempre più interessati all'ESG poiché riflette la responsabilità sociale di un'azienda. Di conseguenza, le aziende sono diventate più consapevoli del loro impatto sull'ambiente e hanno iniziato a riferire regolarmente su questi aspetti.

L'Importanza Crescente della Responsabilità Sociale d'Impresa

La Responsabilità Sociale d'Impresa (CSR) ha visto un aumento di attenzione negli ultimi anni. Questo concetto include attività che le aziende intraprendono per affrontare preoccupazioni sociali e ambientali, oltre a cercare semplicemente profitto. Esempi includono la riduzione dell'inquinamento e le donazioni caritative.

Gli organi di regolamentazione, come quelli dell'UE, hanno iniziato a richiedere alle aziende di divulgare informazioni relative alle loro pratiche di CSR. I criteri per la valutazione ESG coprono vari aspetti, compreso l'impatto ambientale, le relazioni aziendali con le parti interessate e questioni di governance come la responsabilità della leadership e la trasparenza.

Tuttavia, mancano ancora indicatori numerici che misurino efficacemente le prestazioni ESG di un'azienda. Per questo motivo, gran parte dell'analisi è ancora svolta manualmente da esperti del settore.

Utilizzare l'Apprendimento Multi-Task per Collegare Testo ed ESG

In questo studio, miriamo a collegare indicatori stilistici dai rapporti con temi legati all'ESG utilizzando l'apprendimento multi-task. Miglioriamo i modelli linguistici pre-addestrati addestrandoli a classificare il testo in base a sentiment, obiettività, natura proattiva e contenuto ESG.

Mettiamo in evidenza le sfide nel comprendere il sentiment, l'obiettività e gli aspetti proattivi riguardo ai rapporti finanziari. Analizzando e classificando il contenuto nei rapporti annuali in base a questi fattori, possiamo capire meglio come si collegano ai temi ESG.

Il nostro approccio ha dimostrato che un metodo efficace è utilizzare esplicitamente le previsioni dei compiti ausiliari come caratteristiche per il compito principale. Questo metodo si è dimostrato utile anche per compiti soggetti ad alta soggettività.

La metodologia che abbiamo sviluppato può essere applicata a vari temi oltre l'ESG, ampliando la sua rilevanza ad altre aree in cui possono essere ottenuti approfondimenti qualitativi dai dati testuali.

Il Panorama dei Rapporti Annuali

L'analisi dei rapporti annuali è un argomento ben studiato in finanza ma meno nel campo del processamento del linguaggio naturale (NLP). Un focus particolare è stato sui 10-K, che sono rapporti standardizzati richiesti negli Stati Uniti. Tuttavia, al di fuori degli Stati Uniti, i rapporti possono variare significativamente nella loro struttura e modo di comunicare le informazioni.

Nel Regno Unito, ad esempio, c'è stata una notevole crescita nella dimensione e complessità delle narrazioni nei rapporti annuali. Questa crescita riflette una sfida maggiore per l'analisi automatizzata. Mentre il volume di dati è aumentato, la mancanza di standardizzazione rende più complesso l'analisi e richiede metodi più avanzati.

Inoltre, concetti come l'ESG sono relativamente nuovi e non hanno ancora trovato posto nelle pratiche di reporting standardizzato, portando a incongruenze tra le diverse aziende.

Il Ruolo dell'Apprendimento Multi-Task

L'apprendimento multi-task (MTL) è un approccio in cui più compiti correlati vengono risolti simultaneamente, consentendo un apprendimento condiviso che può migliorare le prestazioni. Utilizzando efficacemente l'MTL, possiamo migliorare i risultati in compiti dove i dati potrebbero essere limitati.

In questo studio, abbiamo esaminato come utilizzare varie caratteristiche stilistiche per estrarre informazioni dai rapporti annuali. Questo ha comportato l'impiego di modelli linguistici pre-addestrati all'interno di un contesto MTL supervisionato.

L'idea è di affinare un modello linguistico sui compiti rilevanti per la nostra analisi, sfruttando al contempo le relazioni tra questi compiti. L'efficacia dell'approccio dipende dalle somiglianze tra i compiti. Compiti strettamente correlati possono aiutare a migliorare le prestazioni grazie all'apprendimento condiviso.

Dataset e Annotazione

La nostra analisi si concentra su una raccolta di rapporti annuali di aziende FTSE350 che coprono gli anni 2012-2019. Questo dataset include 1.532 rapporti annuali convertiti dal formato PDF in testo grezzo.

Per il nostro studio, abbiamo generato un dataset annotato, dove le frasi nei rapporti sono state etichettate per cinque compiti specifici. Questi compiti includevano rilevanza, sentiment finanziario, obiettività, dichiarazioni avventurose e contenuto ESG.

Per garantire l'affidabilità, abbiamo calcolato i livelli di accordo tra gli annotatori. Questa valutazione ha mostrato che mentre i compiti di sentiment e ESG avevano un livello di accordo più elevato, i compiti relativi all'obiettività e alla rilevanza avevano livelli di accordo molto più bassi.

Metodi di Classificazione Utilizzati

Nel nostro lavoro di classificazione, abbiamo impiegato un sistema encoder-decoder. L'encoder cattura l'essenza di ogni frase, mentre decodificatori separati gestiscono i compiti di classificazione in base alla rappresentazione condivisa della frase.

Abbiamo utilizzato un modello linguistico pre-addestrato, RoBERTa, noto per la sua efficacia nei compiti di NLP. L'encoder elabora le frasi di input, mentre esistono diversi decodificatori per ciascun compito di classificazione.

Abbiamo esplorato varie architetture MTL e metodi per i compiti di classificazione, inclusi approcci di addestramento sia congiunto che sequenziale. L'obiettivo era ottimizzare le prestazioni sfruttando l'apprendimento condiviso tra i compiti.

Risultati dagli Esperimenti di Apprendimento Multi-Task

Nelle nostre valutazioni sperimentali, abbiamo utilizzato il punteggio macro-F1 come metrica chiave per le prestazioni. Questa metrica è ideale per compiti di classificazione con squilibrio di classe.

Abbiamo suddiviso il nostro dataset in set di addestramento, sviluppo e test, garantendo valutazioni robuste. Ogni metodo è stato eseguito più volte per garantire risultati coerenti.

Tra tutti gli approcci testati, il metodo ExGF-MTL si è distinto come il più efficace. Questo sistema ha permesso al modello di apprendere da ogni compito migliorando le prestazioni del compito di classificazione ESG in particolare.

Indagando varie combinazioni di compiti, abbiamo osservato che escludere compiti meno affidabili come obiettività e rilevanza tendeva a migliorare le prestazioni del modello.

Approfondimenti sui Punteggi ESG e Caratteristiche Testuali

Con ExGF-MTL identificato come il metodo principale, lo abbiamo utilizzato per estrarre caratteristiche dai rapporti annuali e analizzare la loro relazione con i punteggi ESG forniti dalle agenzie finanziarie.

Per preparare i dati, abbiamo accuratamente filtrato le frasi in base a criteri specifici per garantire qualità. Le caratteristiche che abbiamo estratto includevano la proporzione di frasi relative all'ESG e il loro sentiment.

Nella nostra analisi di correlazione, abbiamo utilizzato la correlazione di Spearman per esaminare le relazioni tra caratteristiche testuali e punteggi ESG. Notoriamente, le industrie hanno avuto un impatto sulla correlazione osservata, con alcune caratteristiche che si allineavano strettamente con i loro rispettivi settori.

Ad esempio, l'estensione del contenuto relativo all'ESG ha mostrato una correlazione positiva con punteggi ESG migliori. Questo risultato sottolinea l'importanza di discutere questioni ESG nei rapporti annuali.

Conclusione

In sintesi, questo lavoro sottolinea l'importanza dell'analisi qualitativa nei rapporti finanziari. Applicando tecniche di apprendimento multi-task, possiamo estrarre meglio informazioni significative dal testo, collegandole a metriche ESG importanti.

I risultati dimostrano come sentiment, obiettività e dichiarazioni avventurose possano offrire approfondimenti preziosi sugli sforzi CSR di un'azienda. Inoltre, i metodi sviluppati possono estendersi ad altri campi che richiedono analisi di dati testuali in combinazione con metriche numeriche.

Future ricerche potrebbero esplorare relazioni causali tra caratteristiche nei rapporti e prestazioni finanziarie, migliorando la base di conoscenze riguardo ai comportamenti aziendali e alle loro implicazioni.

Fonte originale

Titolo: Multi-Task Learning for Features Extraction in Financial Annual Reports

Estratto: For assessing various performance indicators of companies, the focus is shifting from strictly financial (quantitative) publicly disclosed information to qualitative (textual) information. This textual data can provide valuable weak signals, for example through stylistic features, which can complement the quantitative data on financial performance or on Environmental, Social and Governance (ESG) criteria. In this work, we use various multi-task learning methods for financial text classification with the focus on financial sentiment, objectivity, forward-looking sentence prediction and ESG-content detection. We propose different methods to combine the information extracted from training jointly on different tasks; our best-performing method highlights the positive effect of explicitly adding auxiliary task predictions as features for the final target task during the multi-task training. Next, we use these classifiers to extract textual features from annual reports of FTSE350 companies and investigate the link between ESG quantitative scores and these features.

Autori: Syrielle Montariol, Matej Martinc, Andraž Pelicon, Senja Pollak, Boshko Koloski, Igor Lončarski, Aljoša Valentinčič

Ultimo aggiornamento: 2024-04-08 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2404.05281

Fonte PDF: https://arxiv.org/pdf/2404.05281

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili