Simple Science

Ciência de ponta explicada de forma simples

# Estatística# Aplicações# Aprendizagem de máquinas# Populações e Evolução# Aprendizagem automática

Comparando Modelos para Previsão de Casos de COVID-19

Uma revisão dos modelos de previsão para casos de COVID-19 em grandes estados dos EUA.

― 8 min ler


Comparação de Modelos deComparação de Modelos dePrevisão da COVID-19previsão de COVID-19.Avaliando a precisão dos modelos de
Índice

Prever a propagação de doenças como a COVID-19 é importante para a saúde pública. Isso ajuda governos e organizações de saúde a decidirem como gerenciar recursos e implementar medidas de saúde. Existem diferentes maneiras de fazer essas previsões, mas ainda temos perguntas sobre o quão bem elas funcionam.

Este artigo analisa dois tipos principais de modelos que prevêem casos de COVID-19: modelos mecanicistas e modelos de séries temporais estatísticas. Vamos comparar a capacidade deles de prever novos casos diários de COVID-19 em seis grandes estados dos Estados Unidos durante o primeiro ano da pandemia.

Importância da Previsão

Previsões de curto prazo visam prever o que vai acontecer em um futuro próximo, normalmente dentro de dias ou semanas. Elas podem guiar decisões sobre quando realizar ações de saúde pública. Previsões de longo prazo, como aquelas que preveem o que vai acontecer em meses ou anos, frequentemente consideram diferentes cenários, como aumento nas taxas de vacinação ou surgimento de novas variantes do vírus.

O desempenho das previsões de curto prazo é avaliado observando o quão próximo elas estão dos números reais de casos relatados depois.

Tipos de Modelos de Previsão

Existem dois tipos amplos de modelos usados para prever a propagação de doenças: modelos mecanicistas e modelos de séries temporais estatísticas.

Modelos Mecanísticos

Esses modelos são baseados em processos conhecidos de propagação da doença. Eles usam fórmulas matemáticas e requerem informações específicas sobre como as doenças funcionam. Eles tentam conectar o que observamos, como o número de casos, com o que não podemos ver, como o número de infecções.

Para criar esses modelos, é essencial saber certas características da doença, como por quanto tempo uma pessoa é contagiosa. Por causa disso, modelos mecanicistas incluem conhecimento sobre a doença, o que pode ser muito útil. Porém, se esse conhecimento estiver errado, as previsões também podem ficar erradas.

Modelos de Séries Temporais Estatísticas

Em contraste, modelos de séries temporais estatísticas focam em padrões nos dados sem precisar entender os processos subjacentes da doença. Eles analisam dados históricos para encontrar tendências e fazem previsões apenas com base nessas observações.

Esses modelos podem ser mais flexíveis e podem funcionar sem precisar de um conhecimento profundo da doença. Eles encontram padrões estatísticos e os aplicam para prever casos futuros.

Comparando Métodos de Previsão

Este artigo examina as previsões de curto prazo feitas por três modelos de séries temporais estatísticas - SARIMA, Prophet e Gaussian Process (GP) - contra dois modelos mecanicistas - EpiEstim e EpiNow2. Usando dados reais sobre casos de COVID-19 de seis grandes estados dos EUA durante o primeiro ano da pandemia, podemos ver qual modelo fornece previsões mais precisas.

Dados e Método

A análise usa os novos casos diários de COVID-19 relatados de 19 de janeiro de 2020 até 15 de março de 2021, em estados como Arizona, Califórnia, Illinois, Maryland, Nova Jersey e Nova York. Os dados foram coletados de fontes respeitáveis e pré-processados para garantir precisão antes de serem usados nos modelos.

Cada modelo é testado prevendo casos ao longo de um período de duas semanas, usando os dados dos dois meses anteriores para treinar os modelos. As previsões são então comparadas com o que realmente aconteceu.

Os Modelos de Previsão em Mais Detalhe

Modelos Mecanísticos

EpiEstim

EpiEstim é baseado em um modelo que estima quantas pessoas estão propensas a serem infectadas ao longo do tempo. Ele usa conhecimento prévio sobre a doença, como o tempo médio que uma pessoa é contagiosa e o número de casos relatados anteriormente, para dar uma estimativa clara de casos futuros.

Esse modelo pode ajustar suas estimativas ao longo do tempo à medida que mais dados se tornam disponíveis. Ele oferece insights úteis sobre como a propagação da doença pode mudar.

EpiNow2

EpiNow2 amplia a abordagem usada no EpiEstim incluindo características adicionais. Ele também estima quantas pessoas estão infectadas ao longo do tempo, mas faz isso com flexibilidade para modelar melhor a incerteza. Considera fatores como o número de pessoas ainda suscetíveis ao vírus e quanto tempo leva para os casos serem reportados.

Modelos de Séries Temporais Estatísticas

SARIMA

Esse modelo prevê casos futuros com base nos padrões de dados do passado. Ele considera tanto os casos passados quanto os erros em previsões anteriores para melhorar as previsões futuras.

Modelos SARIMA têm sido usados para várias doenças e são populares por sua capacidade de ajustar previsões com base em padrões observados.

Prophet

Prophet é uma ferramenta de código aberto projetada para prever dados de séries temporais. É fácil de usar e pode identificar tendências e padrões sazonais. Prophet é adaptável, permitindo que os usuários escolham como querem que o modelo responda a mudanças ao longo do tempo.

Prophet foi aplicado com sucesso em muitos campos, incluindo a previsão de casos de COVID-19.

Gaussian Process (GP)

Modelos de Gaussian Process são complexos, mas eficazes em capturar padrões nos dados. Eles funcionam com a ideia de correlação entre pontos de dados. Ao observar como diferentes observações se relacionam, os modelos GP podem fornecer previsões detalhadas.

GP pode lidar efetivamente com incertezas e se adaptar a novos dados, oferecendo insights detalhados sobre as variações das previsões.

Avaliação do Desempenho das Previsões

Para avaliar o quão bem cada modelo se saiu, usamos várias medidas:

  • Continuous Ranked Probability Score (CRPS): Essa pontuação ajuda a entender a precisão das previsões do modelo em comparação com o que realmente ocorreu. Pontuações mais baixas indicam melhor desempenho.

  • Calibração: Isso mede quão bem as probabilidades previstas correspondem aos resultados reais. Uma boa calibração significa que a confiança do modelo em suas previsões está alinhada com a realidade.

  • Nitidez: Isso reflete quão concentradas estão as previsões. Previsões muito dispersas indicam menos confiança nas estimativas.

  • Viés: Isso mede se um modelo tende a superestimar ou subestimar os casos em comparação com o que aconteceu.

Além disso, focamos em detectar "pontos quentes", que são instâncias de aumentos significativos no número de casos. Essa capacidade de prever mudanças rápidas é crucial para respostas oportunas de saúde pública.

Resultados da Comparação

Os resultados mostram que os modelos de séries temporais estatísticas foram pelo menos tão precisos quanto os modelos mecanicistas no geral. O modelo GP mostrou o melhor desempenho, oferecendo as previsões mais precisas, especialmente ao tentar prever os picos e as quedas dos números de casos.

Embora alguns modelos mecanicistas às vezes tenham superestimado o número de casos, modelos de séries temporais estatísticas como o GP e Prophet mostraram melhor sensibilidade a aumentos rápidos nos casos.

Interpretação dos Resultados

A conclusão tirada dessa comparação é que modelos de séries temporais estatísticas podem ser eficazes na previsão de curto prazo, às vezes igualando ou superando o desempenho dos modelos mecanicistas.

Isso mostra que, embora entender a doença seja útil, não é sempre necessário para fazer previsões de curto prazo. Padrões de dados históricos também podem gerar previsões confiáveis.

Limitações do Estudo

Embora este estudo forneça insights valiosos, algumas limitações devem ser reconhecidas:

  1. Multiplicidade de Erros: O estudo avaliou previsões com base em erros multiplicativos, o que pode ignorar modelos que se saem bem em diferentes circunstâncias.

  2. Métricas de Avaliação: O uso do CRPS oferece uma imagem clara, mas pode não considerar totalmente como os formuladores de políticas veem as saídas do modelo.

  3. Seleção de Modelos: Os modelos comparados são apenas um subconjunto de possíveis ferramentas de previsão. Outros métodos podem gerar previsões ainda melhores.

  4. Análise Retrospectiva: Este estudo olhou para dados passados em vez de fazer previsões em tempo real, o que pode apresentar desafios diferentes.

  5. Viés de Relato: Os casos reais de COVID-19 podem ser maiores do que os relatados devido a problemas de subnotificação.

  6. Escopo Limitado: O foco foi em seis estados e principalmente na COVID-19, o que pode limitar a aplicabilidade mais ampla.

Conclusão

Em resumo, o estudo indica que previsões de curto prazo da COVID-19 podem ser feitas usando modelos de séries temporais estatísticas sem a necessidade de um entendimento profundo da dinâmica da doença. Essa percepção abre caminhos para métodos de previsão mais flexíveis e adaptáveis em contextos de saúde pública.

Trabalhos futuros poderiam aumentar a precisão das previsões usando modelos combinados ou fontes de dados adicionais, como comportamento social ou padrões de mobilidade. À medida que o mundo continua lidando com a COVID-19 e outras doenças infecciosas, melhorar os métodos de previsão continuará sendo uma área vital de pesquisa e aplicação.

Fonte original

Título: A comparison of short-term probabilistic forecasts for the incidence of COVID-19 using mechanistic and statistical time series models

Resumo: Short-term forecasts of infectious disease spread are a critical component in risk evaluation and public health decision making. While different models for short-term forecasting have been developed, open questions about their relative performance remain. Here, we compare short-term probabilistic forecasts of popular mechanistic models based on the renewal equation with forecasts of statistical time series models. Our empirical comparison is based on data of the daily incidence of COVID-19 across six large US states over the first pandemic year. We find that, on average, probabilistic forecasts from statistical time series models are overall at least as accurate as forecasts from mechanistic models. Moreover, statistical time series models better capture volatility. Our findings suggest that domain knowledge, which is integrated into mechanistic models by making assumptions about disease dynamics, does not improve short-term forecasts of disease incidence. We note, however, that forecasting is often only one of many objectives and thus mechanistic models remain important, for example, to model the impact of vaccines or the emergence of new variants.

Autores: Nicolas Banholzer, Thomas Mellan, H Juliette T Unwin, Stefan Feuerriegel, Swapnil Mishra, Samir Bhatt

Última atualização: 2023-05-01 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2305.00933

Fonte PDF: https://arxiv.org/pdf/2305.00933

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes