Simple Science

Ciência de ponta explicada de forma simples

# Finanças Quantitativas# Finanças estatísticas# Econometria# Finanças computacionais

Avaliando Modelos de Previsão de Volatilidade: HAR vs Aprendizado de Máquina

Um estudo comparando o modelo HAR e machine learning na previsão de volatilidade de ações.

― 9 min ler


HAR vs Aprendizado deHAR vs Aprendizado deMáquina em Volatilidadena previsão da volatilidade das ações.O modelo HAR supera o machine learning
Índice

No mundo das finanças, prever como os preços das ações vão mudar é super importante. Isso é especialmente verdade pra entender o quanto os preços sobem e descem, o que chamamos de volatilidade. Acertar nisso pode ajudar as pessoas a gerenciar riscos, precificar opções e melhorar suas estratégias de investimento.

Um método que tem sido útil pra prever a volatilidade é o modelo Heterogeneous Autoregressive (HAR). Essa abordagem olha pra volatilidade média dos últimos dias, semanas e meses pra prever o que vai acontecer em seguida. Apesar de ser simples, o Modelo HAR continua popular porque frequentemente se sai bem em comparação com técnicas de machine learning (ML) mais complicadas.

Nos últimos anos, o machine learning tem ganhado atenção nas finanças. Essas novas ferramentas oferecem a possibilidade de identificar padrões nos dados que os métodos tradicionais podem perder. No entanto, há ceticismo sobre se esses métodos são sempre melhores do que modelos mais simples como o HAR.

No nosso estudo, a gente foca em como o modelo HAR se compara a várias técnicas de machine learning ao prever volatilidade. Descobrimos que a forma como configuramos o modelo HAR, especialmente o tamanho da janela de dados e com que frequência atualizamos nossas previsões, tem um papel crucial na sua precisão. Mesmo com um ajuste extenso dos modelos de machine learning, eles não superaram o HAR quando o modelo foi configurado corretamente.

Um dos principais benefícios do modelo HAR é sua simplicidade. É mais fácil de interpretar, o que significa que as pessoas conseguem entender as previsões sem precisar mergulhar em matemática complexa. O custo computacional pra rodar o modelo HAR também é menor do que o dos modelos de machine learning, que exigem mais poder de processamento.

Pra avaliar o desempenho, usamos várias métricas, incluindo QLIKE e erro quadrático médio (MSE). De forma consistente, descobrimos que o modelo HAR teve um desempenho melhor do que as abordagens de machine learning ao se basear na Volatilidade Realizada e no VIX (um indicador de volatilidade do mercado) pra prever resultados. Isso destaca a importância de escolher cuidadosamente como ajustamos nossos modelos.

No geral, nossa pesquisa mostra que com os métodos de ajuste certos, o modelo HAR pode ser uma ferramenta poderosa pra fazer previsões. Isso também levanta questões sobre as limitações práticas das abordagens de machine learning pra essa tarefa específica.

Introdução

Ter previsões precisas sobre mudanças de preços em ações é crucial nas finanças. Isso pode ajudar os traders a se protegerem contra riscos, definir preços de opções e tomar decisões de investimento informadas. Tem havido muitas pesquisas sobre modelagem da volatilidade das ações recentemente.

O modelo HAR se destaca pela sua simplicidade e eficácia. Ele calcula a volatilidade esperada do dia seguinte com base nas médias de dados passados. Apesar de sua natureza básica, o modelo HAR continua amplamente utilizado porque sempre mostra boa capacidade de previsão.

O machine learning trouxe novas possibilidades pra prever volatilidade. Esses métodos podem potencialmente identificar relações complexas em dados financeiros. No entanto, alguns acreditam que só porque o machine learning é mais avançado, não significa que sempre vai superar modelos mais simples.

Na nossa análise, argumentamos que enquanto o machine learning pode ser poderoso, ele não necessariamente fornece resultados melhores que o modelo HAR pra prever a volatilidade das ações. Este estudo examina a sensibilidade do modelo HAR a como o ajustamos aos dados.

Ao estimar o modelo HAR, dois aspectos importantes devem ser escolhidos: o tamanho da janela de treinamento (quanto de dados passados usar) e a frequência de atualização do modelo (frequência de re-estimativa). Nossos achados indicam que essas escolhas podem impactar bastante a precisão do modelo.

Há uma queda significativa no desempenho da previsão se o modelo não for atualizado diariamente. Enquanto isso, janelas de treinamento maiores tendem a reduzir erros de previsão. Embora janelas maiores e atualizações mais frequentes possam aumentar os custos computacionais, a eficiência do modelo HAR torna isso menos preocupante.

Explorando Literatura Relacionada

Tem havido uma quantidade significativa de pesquisas visando melhorar a previsão da volatilidade. Vários métodos, incluindo machine learning, tentaram aprimorar as previsões além das abordagens tradicionais.

Alguns pesquisadores exploraram usar o operador de encolhimento absoluto mínimo e seleção (lasso) pra previsão. Essa técnica pode selecionar características importantes dos dados e mostrou potencial em recuperar a estrutura do modelo HAR. Outros estudos levaram isso um passo adiante, incorporando variáveis adicionais como indicadores econômicos pra melhorar as previsões.

Apesar dos avanços em machine learning, muitos estudos indicam que o modelo HAR continua competitivo ou até superior em certas instâncias. Isso é especialmente verdadeiro quando o modelo HAR é ajustado corretamente com escolhas apropriadas de treinamento e re-estimativa.

Na nossa pesquisa, também descobrimos que os métodos de machine learning não sempre superaram o modelo HAR, especialmente quando ele foi ajustado com parâmetros ótimos. As diferenças nos estudos anteriores podem muitas vezes ser rastreadas de volta a como os pesquisadores especificaram seus modelos, enfatizando a necessidade de uma consideração cuidadosa sobre como construímos nossas ferramentas de previsão.

Dados e Metodologia

Pra nossa análise, olhamos pra ações negociadas nas principais bolsas dos EUA, focando em um conjunto de dados abrangente para uma variedade diversificada de ações. Isso nos permitiu conduzir uma avaliação minuciosa dos modelos de previsão.

Pra medir a volatilidade prevista, usamos uma métrica chamada volatilidade realizada. Isso envolve usar dados de negociação de alta frequência de várias bolsas pra chegar a estimativas de como os preços das ações são voláteis. Usamos um método bem estabelecido que costuma trazer resultados confiáveis na literatura financeira.

O modelo HAR em si incorpora leituras passadas de volatilidade, junto com uma medida de volatilidade de mercado, o VIX, pra aumentar seu poder preditivo. Essa abordagem permite que ele aproveite tendências de mercado mais amplas enquanto mantém a simplicidade.

No nosso estudo, estimamos os modelos HAR usando tanto os métodos de mínimos quadrados ordinários (OLS) quanto os mínimos quadrados ponderados (WLS), avaliando seu desempenho individualmente e através de estimativas agrupadas de várias ações.

Além disso, comparamos esses modelos tradicionais a várias técnicas de machine learning. Isso incluiu lasso, florestas aleatórias, boosting de gradiente e redes neurais feedforward. Cada uma dessas abordagens tem suas forças e fraquezas, que avaliamos em comparações lado a lado.

Avaliação e Métricas de Desempenho

Pra avaliar o desempenho dos modelos de previsão, usamos o conjunto de dados de teste que abrange quase dois anos. Focamos em métricas como erro quadrático médio (MSE) e QLIKE pra medir a precisão preditiva de cada ação.

Aplicando o procedimento de conjunto de confiança do modelo (MCS), conseguimos comparar estatisticamente os resultados entre diferentes modelos, fornecendo uma visão sobre quais modelos constantemente entregaram melhores previsões. Os resultados indicaram um desempenho forte do modelo HAR, especialmente quando técnicas de ajuste otimizadas foram utilizadas.

As implicações econômicas das previsões também foram levadas em conta. Usando uma estrutura baseada em utilidade, avaliamos quanto valor um investidor poderia derivar das previsões dos modelos. Essa análise ajuda a conectar o desempenho estatístico à tomada de decisão financeira no mundo real.

Principais Descobertas

Após testes minuciosos, descobrimos que o modelo HAR geralmente superou os métodos de machine learning em todas as áreas. Notavelmente, quando modelos de ML foram empregados, eles não forneceram melhorias significativas em relação ao modelo HAR, especialmente quando o HAR foi ajustado corretamente.

Os resultados indicaram que incluir o VIX no modelo HAR aumentou significativamente seu desempenho. Em contraste, os modelos de machine learning muitas vezes não mostraram melhorias consistentes mesmo com informações adicionais incluídas.

Além disso, a escolha do esquema de ajuste para o modelo HAR provou ser um fator crítico em sua precisão de previsão. Essa sensibilidade às escolhas de ajuste pode explicar os resultados variados reportados em estudos anteriores e sublinha a importância das especificações do modelo na previsão da volatilidade.

Em termos de desempenho econômico, o modelo HAR gerou utilidade realizada superior. Isso significa que os investidores estariam dispostos a pagar mais pra aproveitar as previsões fornecidas pelo modelo HAR em comparação com as alternativas de machine learning.

As descobertas afirmam a praticidade do modelo HAR como um referencial confiável pra prever a volatilidade do preço das ações. Apesar da empolgação em torno do machine learning, nosso estudo reforça que modelos mais simples e bem ajustados como o HAR podem ser incrivelmente eficazes.

Conclusão

Nossa análise extensa das ações revela que o modelo HAR continua sendo uma ferramenta formidável pra prever a volatilidade financeira. Embora as técnicas de machine learning tenham ganhado espaço nas finanças, nosso estudo demonstra que elas não necessariamente superam o modelo HAR, especialmente quando este é especificado de maneira precisa.

A natureza direta do modelo HAR permite fácil interpretação e custos computacionais menores, vantagens que não devem ser ignoradas. A sensibilidade ao esquema de ajuste também destaca a importância da seleção cuidadosa do modelo pra alcançar os melhores resultados de previsão.

Seguindo em frente, nossa pesquisa estabelece tanto o valor do modelo HAR quanto a necessidade de investigação contínua sobre como abordagens de machine learning podem ser integradas de forma pensativa nas previsões financeiras. Estudos futuros poderiam explorar conjuntos de dados mais ricos e diferentes contextos pra ver como essas ferramentas podem se complementar pra uma precisão preditiva aprimorada no mundo em constante mudança das finanças.

Fonte original

Título: HARd to Beat: The Overlooked Impact of Rolling Windows in the Era of Machine Learning

Resumo: We investigate the predictive abilities of the heterogeneous autoregressive (HAR) model compared to machine learning (ML) techniques across an unprecedented dataset of 1,455 stocks. Our analysis focuses on the role of fitting schemes, particularly the training window and re-estimation frequency, in determining the HAR model's performance. Despite extensive hyperparameter tuning, ML models fail to surpass the linear benchmark set by HAR when utilizing a refined fitting approach for the latter. Moreover, the simplicity of HAR allows for an interpretable model with drastically lower computational costs. We assess performance using QLIKE, MSE, and realized utility metrics, finding that HAR consistently outperforms its ML counterparts when both rely solely on realized volatility and VIX as predictors. Our results underscore the importance of a correctly specified fitting scheme. They suggest that properly fitted HAR models provide superior forecasting accuracy, establishing robust guidelines for their practical application and use as a benchmark. This study not only reaffirms the efficacy of the HAR model but also provides a critical perspective on the practical limitations of ML approaches in realized volatility forecasting.

Autores: Francesco Audrino, Jonathan Chassot

Última atualização: 2024-06-12 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2406.08041

Fonte PDF: https://arxiv.org/pdf/2406.08041

Licença: https://creativecommons.org/licenses/by-sa/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes