Avanço na Detecção de Doenças Cardíacas com Novos Algoritmos
Um novo algoritmo mostra potencial em detectar sopros cardíacos de forma eficaz.
― 8 min ler
Índice
- O Problema com os Métodos de Detecção Atuais
- Nossa Abordagem
- Desafios de Dados
- O Desafio PhysioNet 2022
- Métodos Usados no Nosso Algoritmo
- Processamento de Dados
- Extração de Características
- Previsões com Redes Neurais
- Modelos Semi-Markov Ocultos
- Resultados
- Comparando com Outras Abordagens
- Discussão
- Importância da Rotulagem Precisa
- Direções Futuras
- Conclusão
- Fonte original
Doença cardíaca é uma das principais causas de morte no mundo todo, com milhões de pessoas morrendo por causa disso todo ano. Apesar de ser sério, muitos tipos de doença cardíaca não são muito conhecidos, levando a muitos casos não diagnosticados, especialmente entre os mais jovens. Um problema comum é a doença cardíaca valvular reumática, que afeta muita gente, principalmente em países em desenvolvimento. É super importante descobrir essas doenças cardíacas cedo pra oferecer um tratamento melhor e evitar problemas a longo prazo.
Pra detectar doenças cardíacas, os médicos costumam ouvir o coração com um estetoscópio. Esse método permite que eles escutem sons anômalos, como Sopros Cardíacos, que podem indicar problemas nas válvulas do coração. Porém, nem todos os médicos são igualmente habilidosos em usar um estetoscópio, e muitos não conseguem detectar problemas cardíacos com precisão. Por isso, uma maneira fácil e acessível de fazer triagem pra essas doenças é necessária, especialmente em lugares com menos recursos.
O Problema com os Métodos de Detecção Atuais
Atualmente, a única ferramenta amplamente utilizada pra detectar sons cardíacos na atenção primária é o estetoscópio. Embora seja um teste rápido e simples, sua eficácia pode variar muito entre os médicos. Um médico experiente pode detectar problemas nas válvulas do coração com precisão só cerca de metade das vezes. Essa baixa taxa de sucesso destaca a necessidade de métodos mais confiáveis de identificar condições cardíacas, especialmente em áreas que carecem de cuidados especializados.
A análise automatizada de sons cardíacos, que usa gravações de dispositivos eletrônicos, é uma maneira promissora de melhorar a detecção de sopros. Nos últimos anos, pesquisadores sugeriram novos métodos que se baseiam em aprendizado de máquina e inteligência artificial. No entanto, muitos desses métodos ainda enfrentam problemas como o overfitting, onde o modelo aprende demais com os dados de treinamento e não se sai bem com dados novos.
Pra enfrentar esse problema, o Desafio George B. Moody PhysioNet 2022 pediu que equipes criassem Algoritmos que pudessem detectar sopros cardíacos em um novo conjunto de dados pediátricos. Esse desafio tinha como objetivo comparar diferentes métodos e encontrar soluções eficazes para uso clínico real.
Nossa Abordagem
No nosso trabalho, apresentamos um novo algoritmo que se mostrou bem-sucedido no desafio PhysioNet. Diferente de muitas outras equipes que usaram modelos de aprendizado profundo complexos, nossa abordagem utilizou um método diferente baseado em lições aprendidas de desafios anteriores. Focamos em análise comparativa, examinando como nosso algoritmo se saiu em duas tarefas distintas.
Desafios de Dados
Uma questão chave na pesquisa sobre análise automatizada de sons cardíacos é a disponibilidade de dados de alta qualidade. A maioria dos estetoscópios usados em hospitais ainda são do tipo analógico tradicional, o que significa que gravações de sons cardíacos não são comumente guardadas. Isso dificulta a criação de conjuntos de dados abrangentes para pesquisa. Assim, pesquisadores frequentemente dependem de dados disponíveis publicamente, embora esses conjuntos apresentem seus próprios desafios.
Um exemplo de um conjunto de dados útil é o do desafio PhysioNet 2016. No entanto, esse conjunto tem limitações, pois não inclui detalhes suficientes sobre como as gravações foram feitas ou os resultados dos pacientes. O desafio 2022 buscou superar algumas dessas barreiras ao fornecer um novo conjunto de dados especificamente projetado pra esse propósito.
O Desafio PhysioNet 2022
Os participantes do Desafio PhysioNet 2022 tiveram que desenvolver algoritmos pra detectar sopros cardíacos e prever os resultados de saúde dos pacientes usando um novo conjunto de dados coletado no Brasil. Esse conjunto contém gravações feitas com um estetoscópio eletrônico específico em vários pacientes ao longo de uma série de programas de triagem.
O desafio forneceu dados em duas partes principais: uma pra treinar algoritmos e outra pra testar seu desempenho. Enquanto as equipes criavam seus algoritmos, podiam refinar seus modelos com base em como se saíram no conjunto de validação.
Métodos Usados no Nosso Algoritmo
Nosso algoritmo usou uma combinação de técnicas pra analisar sons cardíacos de forma eficaz. Aqui, destacamos as etapas envolvidas na nossa abordagem.
Processamento de Dados
Pra começar, transformamos as gravações brutas dos sons do coração em um formato que facilita a análise. Isso envolveu normalizar a amplitude dos sons, permitindo uma comparação consistente, independentemente de como o estetoscópio foi usado ou a condição do paciente. Focamos na extração de características chave das gravações, que podem servir como indicadores de saúde cardíaca.
Extração de Características
Ao processar as gravações, criamos uma representação visual conhecida como log-espectrograma. Esse formato nos permite observar as mudanças de frequência ao longo do tempo, o que ajuda na identificação de diferentes sons cardíacos. Usamos um método que suaviza ruídos indesejados e melhora a clareza dos sinais observados.
Previsões com Redes Neurais
Em seguida, aplicamos uma Rede Neural recorrente (RNN) pra fazer previsões sobre o que ouvimos nas gravações. Esse tipo de rede é projetada pra lidar com sequências de dados, o que é perfeito pra analisar sons ao longo do tempo. A RNN se concentra em distinguir entre diferentes sons do coração, como S1, S2 e sopros.
Modelos Semi-Markov Ocultos
Pra refinar ainda mais nossas previsões, usamos modelos semi-Markov ocultos. Esses modelos ajudam a interpretar a saída da nossa RNN pra segmentar os sons cardíacos com precisão, levando em conta o tempo e a sequência dos eventos. Esse método melhora nossa capacidade de identificar sopros e avaliar a qualidade das gravações.
Resultados
Nosso algoritmo obteve resultados impressionantes em ambas as tarefas do desafio. Na tarefa de detecção de sopros, teve uma taxa de sensibilidade de quase 93%, significando que conseguiu identificar corretamente uma alta porcentagem de casos em que os sopros estavam presentes. Na tarefa de Resultados Clínicos, nosso algoritmo ficou em primeiro lugar, demonstrando sua eficácia em prever a saúde dos pacientes com base nos sons do coração deles.
Comparando com Outras Abordagens
Muitas outras equipes dependeram bastante de modelos de aprendizado profundo, que são poderosos, mas podem facilmente se adaptar demais a pequenos conjuntos de dados. Em contraste, nossa abordagem, usando modelos mais simples combinados com técnicas eficazes de processamento de dados, se saiu bem consistentemente em diferentes conjuntos de teste. Observamos que equipes com algoritmos mais complexos às vezes tiveram dificuldades com generalização, enquanto nosso método estruturado proporcionou resultados sólidos sem overfitting.
Discussão
Enquanto nosso algoritmo demonstrou sucesso em detectar sopros cardíacos e prever resultados clínicos, ainda há desafios a serem enfrentados. Uma questão chave é a dependência de rótulos precisos para os sons cardíacos, que podem variar dependendo da experiência e do equipamento do clínico.
Importância da Rotulagem Precisa
A qualidade das anotações dos sons cardíacos é crucial pra treinar e avaliar algoritmos. Nosso conjunto de dados teve anotações feitas por um único clínico, e isso pode levar a inconsistências. No futuro, ter vários revisores pra rotular poderia aumentar a confiabilidade dos dados.
Direções Futuras
Avançando, queremos explorar como nosso algoritmo pode integrar mais informações dos pacientes, como idade e histórico médico, pra melhorar ainda mais as previsões. Focando em tipos específicos de doenças cardíacas que são conhecidas por produzir sons distintos, podemos desenvolver ferramentas que não sejam apenas sensíveis, mas também específicas para condições particulares.
Conclusão
Resumindo, nosso algoritmo representa um grande avanço na detecção de sopros cardíacos e na previsão de resultados dos pacientes. A combinação de técnicas de modelagem avançadas, processamento de dados eficaz e avaliação cuidadosa levou a um sucesso notável no Desafio PhysioNet 2022. Continuando a aprimorar esses métodos e a enfrentar limitações atuais, podemos contribuir para melhores ferramentas de monitoramento da saúde cardíaca que poderão ajudar muitos pacientes no futuro.
De forma geral, nossas descobertas destacam o potencial da análise automatizada de sons cardíacos pra melhorar a prática clínica, especialmente em lugares onde o acesso a especialistas é limitado. Esforços futuros devem se concentrar em implementações amigáveis de tais ferramentas pra promover o uso generalizado em ambientes de atenção primária.
Título: A recurrent neural network and parallel hidden Markov model algorithm to segment and detect heart murmurs in phonocardiograms
Resumo: Detection of heart disease using a stethoscope requires significant skill and time, making it expensive and impractical for widespread screening in low-resource environments. Machine learning analysis of heart sound recordings can improve upon the accessibility and accuracy of diagnoses, but existing approaches require further validation on larger and more representative clinical datasets. For many previous algorithms, segmenting the signal into its individual sound components is a key first step. However, segmentation algorithms often struggle to find S1 or S2 sounds in the presence of strong murmurs or noise that significantly alter or mask the expected sound. Segmentation errors then propagate to the subsequent disease classifier steps. We propose a novel recurrent neural network and hidden semi-Markov model (HSMM) algorithm that can both segment the signal and detect a heart murmur, removing the need for a two-stage algorithm. This algorithm formed the CUED Acoustics entry to the 2022 George B. Moody PhysioNet challenge, where it won the first prize in both the challenge tasks. The algorithms performance exceeded that of many end-to-end deep learning approaches that struggled to generalise to new test data. As our approach both segments the heart sound and detects a murmur, it can provide interpretable predictions for a clinician. The model also estimates the signal quality of the recording, which may be useful for a screening environment where non-experts are using a stethoscope. These properties make the algorithm a promising tool for screening of abnormal heart murmurs. Author summaryThe use of machine learning algorithms to detect heart disease from sound recordings has great potential to enable widespread and low-skill screening, improving early detection and treatment. The area has seen increasing interest in recent years, with many novel algorithms inspired by deep learning advancements in other fields. However, the size of heart sound datasets remains small, making deep learning models particularly susceptible to overfitting. In addition, the performance of these algorithms has rarely been directly compared on unseen data. We describe a novel lightweight algorithm to detect and classify murmurs in heart sound recordings. This algorithm was the winning entry into the George B. Moody PhysioNet 2022 challenge, beating many complex deep-learning approaches. Our approach both detects and localises the murmur, providing an interpretable result for a clinician.
Autores: Andrew McDonald, M. J. F. Gales, A. Agarwal
Última atualização: 2023-12-29 00:00:00
Idioma: English
Fonte URL: https://www.medrxiv.org/content/10.1101/2023.12.26.23300540
Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.12.26.23300540.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.