Simple Science

Ciência de ponta explicada de forma simples

# Ciências da saúde# Informatica sanitaria

Prevendo Mudanças na Função Pulmonar em Pacientes com SSc-ILD Usando Aprendizado de Máquina

Esse estudo explora como o aprendizado de máquina pode prever mudanças na função pulmonar em SSc-ILD.

― 8 min ler


Aprendizado de Máquina emAprendizado de Máquina emDoenças PulmonaresSSc-ILD.função pulmonar em pacientes comModelos de previsão avançados para a
Índice

A Esclerose Sistêmica (SSc) é uma doença de longo prazo que afeta o sistema imunológico e prejudica os vasos sanguíneos. Ela pode causar alterações no funcionamento de vários órgãos e tecidos do corpo. Um problema sério que pode surgir da SSc é uma condição chamada Doença Pulmonar Intersticial (DPI). A DPI acontece quando há muita cicatriz nos pulmões, dificultando a respiração dos pacientes. Isso pode piorar com o tempo e é uma das razões mais comuns para visitas ao hospital e mortes em pessoas com SSc.

Como a DPI é um grande problema para quem tem SSc, consultas regulares são super importantes. Os médicos monitoram de perto a função pulmonar para detectar qualquer mudança logo no início. Normalmente, esse processo envolve tirar imagens detalhadas dos pulmões e fazer testes para avaliar como eles estão funcionando.

Métodos Atuais para Monitorar Doença Pulmonar

Atualmente, os médicos usam tomografias computadorizadas de alta resolução (HRCT) do tórax para ver o quanto os pulmões estão afetados. Eles também fazem Testes de Função Pulmonar (PFTs) para avaliar a saúde dos pulmões. Novos métodos de análise que olham pra informações coletadas das tomografias HRCT mostraram resultados promissores em prever quanto tempo os pacientes com SSc-DPI podem viver sem problemas de saúde sérios.

Outro estudo mostrou que certas medidas, como a Capacidade Vital Forçada (CVF) e a habilidade dos pulmões de transferir gases (DLCO), podem indicar como a DPI está progredindo em pacientes individuais. No entanto, cada paciente é diferente, e alguns têm uma progressão da doença mais rápida que outros, o que aumenta o risco de complicações. Entender como a função pulmonar de cada paciente muda ao longo do tempo é crucial para oferecer o melhor cuidado.

Avanços na Previsão da Progressão da Doença

Pesquisadores têm buscado sinais ou marcadores que ajudem a prever como a SSc-DPI vai progredir. Alguns estudos identificaram alguns marcadores potenciais que podem ajudar a prever a progressão da doença. Por exemplo, alguns pesquisadores desenvolveram um modelo de previsão com base em como bem um paciente caminha e se ele tem problemas nas articulações. Outros estudos encontraram fatores diferentes, como ser homem ou não ter tomado aspirina antes, que podem estar ligados à progressão da doença.

Apesar desses avanços, ainda não existe uma forma definitiva de prever como a DPI vai progredir em nível individual. Também não há consenso sobre a frequência que os pacientes devem ser rastreados ou os melhores métodos para fazer isso.

As diversas descobertas podem ser devidas às diferenças nos grupos de pacientes estudados. Além disso, muitos desses estudos usaram técnicas de análise padrão que podem não capturar a complexidade dos dados. Com o avanço da tecnologia, o Aprendizado de Máquina (ML) surgiu como uma ferramenta poderosa. Ele ajuda a extrair informações úteis de grandes conjuntos de dados, que podem oferecer melhores insights sobre o cuidado dos pacientes.

Como o Aprendizado de Máquina Pode Ajudar

Métodos de aprendizado de máquina podem analisar informações complexas e ajudar na tomada de decisões. Por exemplo, pesquisadores usaram com sucesso ML para prever o desenvolvimento de doenças oculares analisando dados genéticos e de imagem. Eles também usaram isso para identificar pacientes em risco de doenças cardíacas ao avaliar a evolução da placa nas artérias. Métodos semelhantes podem ser aplicados à SSc-DPI para prever mudanças na função pulmonar ao longo do tempo.

Nossa Contribuição

Neste estudo, focamos em prever futuros valores de função pulmonar em pacientes com SSc-DPI usando aprendizado de máquina. Criamos linhas do tempo para cada paciente, reunindo informações das suas visitas e preservando a ordem dos eventos. Nos propomos a enfrentar vários objetivos principais:

  1. Desenvolver um novo modelo especificamente desenhado para entender as mudanças na função pulmonar em pacientes com SSc-DPI.
  2. Comparar nosso novo modelo com vários modelos ML padrão para avaliar sua precisão.
  3. Analisar como certos fatores podem afetar a precisão das nossas previsões.
  4. Testar um método que melhore a incerteza nas previsões.
  5. Determinar quais características tiveram papéis significativos nas previsões do nosso modelo.

Coleta de Dados dos Pacientes

Utilizamos um grande banco de dados que contém informações de milhares de pacientes. Esse banco inclui detalhes sobre saúde, dados demográficos e dados clínicos ao longo de várias visitas. Para nossa análise, incluímos pacientes que atenderam a critérios específicos, como ser adultos com DPI diagnosticada confirmada por testes de imagem, que tinham medições de função pulmonar registradas e que fizeram várias visitas à clínica.

Entendendo as Trajetórias dos Pacientes

Organizamos os dados coletados em linhas do tempo dos pacientes, permitindo ver como a condição de cada um evoluiu ao longo do tempo. Cada visita contribuiu para uma imagem mais clara da saúde e função pulmonar do paciente. O objetivo era usar visitas passadas para prever resultados futuros da função pulmonar.

Analisando Características dos Pacientes

Nosso grupo de estudo final consistiu em mais de 2000 pacientes, a maioria mulheres, com uma idade média em torno de 53 anos. Os dados mostraram uma variedade de características, incluindo idade, gênero e hábitos de fumar. Essas características ajudaram a fornecer um contexto adicional para entender a saúde de cada paciente.

Modelos de Progressão da Doença

Usando os dados das linhas do tempo, focamos em prever os resultados futuros para pacientes com base nas suas visitas anteriores. Empregamos várias técnicas de modelagem, incluindo:

  • Redes Neurais Recorrentes (RNN): Esse tipo de modelo é excelente para lidar com dados sequenciais como as linhas do tempo dos nossos pacientes.
  • Redes Transformer: Outro modelo avançado que pode destacar a importância de diferentes fatores nas previsões.
  • Processos Neurais Atenciosos (ANP): Este modelo é projetado para aprender com os dados de forma eficiente e fornecer estimativas de incerteza para suas previsões.

Medindo a Precisão da Previsão

Usamos vários métodos para avaliar como nossos modelos se saíram em termos de precisão. Uma das principais medidas foi o Erro Quadrático Médio (RMSE), que ajudou a avaliar quão próximas as previsões estavam dos resultados reais. Também avaliamos como diferentes fatores influenciaram as previsões.

Incerteza nas Previsões

Entendendo que as previsões nem sempre são precisas, analisamos como nossos modelos poderiam fornecer estimativas de incerteza. Por exemplo, avaliamos quão provável era que a função pulmonar real ficasse dentro de uma certa faixa prevista. Essa estimativa de incerteza é importante para os médicos tomarem decisões informadas sobre o cuidado do paciente.

Importância das Características nas Previsões

Analisamos quais características foram mais influentes nas nossas previsões. Essa análise revelou que medições anteriores da função pulmonar e fatores como a extensão do envolvimento da pele, idade e certos detalhes clínicos desempenharam papéis significativos. Esses insights podem ajudar os clínicos a entender quais fatores devem ser monitorados de perto em pacientes.

Importância da Documentação do Tratamento

Uma descoberta notável foi a importância da documentação precisa do tratamento. Observamos que, à medida que o nível de documentação da terapia aumentava, as previsões dos modelos melhoravam. Isso destaca a necessidade de um registro minucioso na saúde para ajudar a treinar modelos de previsão mais eficazes no futuro.

Conclusão

Nossa pesquisa demonstra o potencial de usar técnicas avançadas de aprendizado de máquina para prever mudanças na função pulmonar de pacientes com SSc-DPI. Os resultados mostraram que modelos sequenciais superaram métodos padrão, fornecendo insights precisos nas trajetórias dos pacientes. Essa abordagem não só melhora nossa compreensão de como a doença pode progredir, mas também fornece ferramentas valiosas para que os prestadores de saúde gerenciem e tratem os pacientes de forma mais eficaz. Ao prever com precisão resultados futuros de saúde, podemos tomar decisões mais informadas no cuidado dos pacientes, melhorando assim a qualidade de vida de quem vive com SSc-DPI.

Fonte original

Título: Predicting Interstitial Lung Disease Progression in Patients with Systemic Sclerosis Using Attentive Neural Processes - A EUSTAR Study

Resumo: AO_SCPLOWBSTRACTC_SCPLOWO_ST_ABSBackgroundC_ST_ABSSystemic sclerosis (SSc) is an autoimmune disease with high mortality with lung involvement being the primary cause of death. Progressive interstitial lung disease (ILD) leads to a decline in lung function (forced vital capacity, FVC% predicted) with risk of respiratory failure. These patients could benefit from an early and tailored pharmacological intervention. However, up to date, tools for prediction of individual FVC changes are lacking. In this paper, we aimed at developing a trustworthy machine learning system that is able to guide SSc management by providing not only robust FVC predictions, but also uncertainty quantification (i.e. the degree of certainty of model prediction) as well as similarity-based explainability for any patient P (i.e. a list of past SSc patients with similar FVC trajectories like P). We further aimed to identify the key clinical factors influencing the models predictions and to use model-guided data representation to identify SSc patients with similar sequential FVC measurements. MethodsWe trained and evaluated machine learning (ML) models to predict SSc-ILD trajectory as measured by FVC% predicted values using the international SSc database managed by the European Scleroderma Trials and Research group (EUSTAR), which comprises clinical, laboratory and functional parameters. EUSTAR records patients data in annual assessment visits, and, given any visit, we aimed at predicting the FVC value of a patients subsequent visit, taking into account all available patient data (i.e. baseline and follow-up visit data up to the time point where we make the prediction). For training of our ML models, we included 2220 SSc patients that had at least 3 recorded visits in the EUSTAR database, were at least 18 years old, had confirmed ILD and sufficient clinical documentation. We developed sequential ML models implementing the attentive neural process formalism with either a recurrent (ANP RNN) or transformer encoder (ANP transformer) architecture. We compared these architectures with baseline sequential models including gated recurrent neural networks (RNNs) and multi-head self-attention transformer-based networks. Baseline non-sequential models included tree-based models such as gradient boosting trees, and regression-based models with varying regularization schemes. Our experiments used stratified 5-fold cross-validation to train and test the models using the average root mean squared error (RMSE), weighted RMSE, and mean absolute error (MAE) as performance metrics. We computed the coverage and Winkler score for uncertainty quantification, SHAP values for grading the input features importance and used the data embeddings of the ANP architectures for both similarity-based explainability and the identification of similar SSc patient journeys. ResultsPatients baseline FVC scores ranged from 22 to 150% predicted with a mean (SD) of 90.53% predicted (21.52). Our deep learning models showed better performance for FVC forecasting, compared to tree- and regression-based models. The top performing ANP RNN architecture was able to closely model future FVC values with average (SD) performance of 8.240 (0.168) weighted RMSE and 6.94 (0.190) MAE that was further used as feature generator for a logistic regression trained to predict a FVC% decline of at least 10% points achieving 0.704 AUC score. In comparison, a naive baseline using the mean FVC value as a predictor achieved much lower FVC forecasting capabilities, with 18.718 (0.317) weighted RMSE, and 17.619 (0.599) MAE. SHAP value analysis indicated that prior FVC measurements, diffusion of carbon monoxide (DLCO) values, skin involvement, age, anti-centromere positivity, dyspnea and CRP-elevation contributed most to deep-learning-based FVC predictions. Regarding uncertainty quantification, ANP RNN achieved 79% coverage (i.e. the model would provide uncertainty estimates that included the true future FVC value in 79 out of 100 predictions) out of the box, and 90% using an additional conformal prediction module with an corresponding Winkler score of 892 (indicating the width of the uncertainty estimate plus penalty for mistakes), smaller than any other model at the same coverage level. We further demonstrate how the data abstraction provided by the ANP RNN model (embeddings) allows for deriving similar patient trajectories (for similarity-based explanation). ConclusionsOur study demonstrates the feasibility of FVC forecasting and thus the ability to predict ILD trajectories in individual SSc patients using deep learning. We show that model predictions can be paired with uncertainty quantification and similarity-based model explainability, which are crucial elements for deploying trustworthy ML algorithms. Our study is thus an important first step towards reliable automated ILD trajectory (i.e. FVC%) prediction system with potential clinical utility.

Autores: Ahmed Allam, A. N. Horvath, M. Dittberner, C. Trottet, E. Siegert, V. Sobanski, P. Carreira Delgado, D. Lorenzo, V. Smith, S. Guiducci, N. Hunzelmann, A.-M. Hoffmann-Vold, S. Trugli, A. M. Gheorghiu, A. Svetlana, C. Ribi, M. Krauthammer, B. Maurer, EUSTAR Collaborators

Última atualização: 2024-04-26 00:00:00

Idioma: English

Fonte URL: https://www.medrxiv.org/content/10.1101/2024.04.25.24306365

Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.04.25.24306365.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes