Aproveitando Modelos de Linguagem para Análise de Ações
Usando grandes modelos de linguagem pra melhorar estratégias de investimento e analisar relatórios anuais.
― 6 min ler
Índice
Relatórios Anuais de empresas de capital aberto são documentos importantes que dão uma ideia da saúde financeira de uma empresa. Esses relatórios podem ser bem longos, muitas vezes passando de 100 páginas, o que torna a análise bem difícil. Essa análise é crucial para entender como o desempenho de uma empresa pode afetar seu preço de ações. Enquanto especialistas financeiros conseguem extrair informações úteis rapidamente desses relatórios, isso exige muito treinamento e experiência. A ideia aqui é simplificar o processo de analisar todos esses relatórios anuais usando uma tecnologia avançada conhecida como Modelos de Linguagem Grande (LLMs).
Essa abordagem combina as informações geradas pelos LLMs com dados históricos de preços de ações para criar um conjunto de dados estruturado. Depois, um Modelo de aprendizado de máquina é treinado usando essas informações como características. Testes mostram que esse método pode oferecer retornos melhores em comparação com o índice S&P 500. A intenção é oferecer uma nova estrutura para estudos futuros nessa área.
A Importância dos Relatórios Anuais
Os dados de ações são baseados em empresas nos Estados Unidos, especificamente nas 1500 maiores empresas por capitalização de mercado, que fazem parte de vários índices do S&P, como o S&P 500, S&P 400 e S&P 600. Empresas listadas nos EUA devem enviar relatórios anuais detalhados para uma entidade reguladora chamada Comissão de Valores Mobiliários dos EUA (SEC). Esses relatórios, conhecidos como filings 10-K, fornecem uma visão abrangente do desempenho financeiro, operações e riscos de uma empresa. Eles servem como recursos essenciais para investidores, analistas e outras partes interessadas tomarem decisões de investimento informadas.
Além de demonstrações financeiras como balanços e demonstrações de resultados, os relatórios 10-K contêm seções como visões gerais do negócio e fatores de risco. Essas seções oferecem insights valiosos, mas não podem ser facilmente quantificados. A avaliação delas muitas vezes depende da perspectiva e experiência individual, tornando difícil a análise.
Usando Tecnologia para Melhorar a Análise
Recentemente, ferramentas avançadas chamadas LLMs, incluindo modelos como o GPT-3.5 (frequentemente chamado de ChatGPT), se tornaram poderosas para analisar documentos extensos. Esses modelos conseguem resumir documentos e fornecer respostas para perguntas complexas. Um estudo mostrou que os LLMs podem ser eficazes para prever preços de ações, respondendo perguntas que os analistas financeiros poderiam fazer, como se a empresa tem uma estratégia clara de crescimento.
Coletando Dados
Para desenvolver um modelo útil, é importante coletar relatórios anuais das 1500 principais empresas. O banco de dados Edgar da SEC contém filings 10-K históricos, que podem ser acessados e armazenados. Para este estudo, foram coletados relatórios de 2002 a 2023, totalizando mais de 24.200 documentos. Essa coleção fornece um grande conjunto de dados que pode ser usado para várias análises.
Quando uma pergunta específica sobre o relatório de uma empresa é feita, as seções relevantes do 10-K oferecem o contexto necessário para que o LLM gere respostas informativas. Essas respostas servem como características de entrada para um modelo de aprendizado de máquina, que ajuda a prever o desempenho das ações.
Atribuindo Valores Alvo
Além de gerar características, o próximo passo envolve atribuir valores alvo às ações. O valor alvo para uma ação é calculado com base no seu retorno percentual entre dois filings anuais. Para ser conservador, o preço da ação dois dias após um filing é usado como ponto de partida, e dois dias antes do próximo filing é o ponto final. Além disso, diferentes intervalos durante esse período são analisados para obter uma visão abrangente do desempenho das ações.
Esse método permite uma análise comparativa em relação ao índice S&P 500, possibilitando uma comparação de desempenho quando o modelo de aprendizado de máquina é testado.
Desenvolvimento do Modelo de Aprendizado de Máquina
Depois de coletar e atribuir os dados, o próximo passo é dividi-los em conjuntos de treinamento e teste. Os dados de 2002 a 2017 são usados para treinamento, enquanto os dados de 2018 a 2023 são usados para teste. O objetivo aqui é criar um modelo que possa prever o desempenho futuro das ações com base nas características geradas pelo LLM.
Um modelo de aprendizado de máquina simples, especificamente Regressão Linear, é utilizado neste estudo. A escolha desse método garante que as relações entre características e variáveis alvo sejam positivas ou neutras. Isso é crucial, já que as características desenvolvidas a partir do LLM têm a intenção de refletir correlações positivas com os retornos das ações.
Resultados do Modelo
Uma vez feitas as previsões no conjunto de teste, os resultados indicam que o modelo usando características geradas por LLM se sai melhor do que o índice S&P 500 na seleção de ações. Uma comparação revela que os retornos são maiores quando menos ações são selecionadas, sugerindo que escolher ações de maior classificação leva a um desempenho melhor.
Avaliando Estratégias de Investimento
Entre as estratégias analisadas, ficou claro que um número menor de seleções de ações gera retornos mais altos. Por exemplo, escolher apenas cinco ações pode representar uma boa estratégia de investimento, já que permite focar nas melhores opções.
A análise dos retornos cumulativos para várias estratégias indica que ambos os modelos superam o índice S&P 500 durante um determinado período. Os resultados destacam a importância de selecionar a variável alvo certa para alcançar um desempenho melhor.
Conclusão
Essa análise mostra que as pontuações geradas pelos LLMs, como o GPT-3.5, podem servir como características valiosas para desenvolver um modelo de aprendizado de máquina. A flexibilidade em definir a variável alvo abre muitas possibilidades para mais pesquisas.
Quando o modelo é construído corretamente, ele pode oferecer retornos que superam o índice S&P 500, o que é significativo, já que muitas estratégias tradicionais de investimento podem acarretar altos custos de transação, limitando a lucratividade. A estrutura proposta aqui demonstra que uma estratégia de investimento de longo prazo utilizando LLMs pode ser benéfica, reduzindo assim o ônus de custos de transação excessivos.
Resumindo, a integração de modelos de linguagem avançados com aprendizado de máquina oferece uma avenida promissora para aprimorar estratégias de investimento em ações, abrindo caminho para mais exploração e desenvolvimento nessa área.
Título: GPT-InvestAR: Enhancing Stock Investment Strategies through Annual Report Analysis with Large Language Models
Resumo: Annual Reports of publicly listed companies contain vital information about their financial health which can help assess the potential impact on Stock price of the firm. These reports are comprehensive in nature, going up to, and sometimes exceeding, 100 pages. Analysing these reports is cumbersome even for a single firm, let alone the whole universe of firms that exist. Over the years, financial experts have become proficient in extracting valuable information from these documents relatively quickly. However, this requires years of practice and experience. This paper aims to simplify the process of assessing Annual Reports of all the firms by leveraging the capabilities of Large Language Models (LLMs). The insights generated by the LLM are compiled in a Quant styled dataset and augmented by historical stock price data. A Machine Learning model is then trained with LLM outputs as features. The walkforward test results show promising outperformance wrt S&P500 returns. This paper intends to provide a framework for future work in this direction. To facilitate this, the code has been released as open source.
Autores: Udit Gupta
Última atualização: 2023-09-06 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2309.03079
Fonte PDF: https://arxiv.org/pdf/2309.03079
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.