Simple Science

La science de pointe expliquée simplement

# Informatique# Apprentissage automatique

Détection avancée des souffles cardiaques avec l'IA

Une nouvelle méthode d'IA améliore la détection des souffles cardiaques pour un diagnostic précoce.

― 6 min lire


IA dans la Détection desIA dans la Détection desSouffles Cardiaquescardiaques.dépistage précoce des maladiesDe nouvelles méthodes améliorent le
Table des matières

Les souffles cardiaques sont des sons causés par un flux sanguin turbulent dans le cœur. Ils peuvent indiquer des problèmes structurels avec le cœur, y compris des maladies cardiaques congénitales. Ce phénomène se produit lorsque les structures du cœur se développent mal pendant la petite enfance. Détecter les souffles cardiaques tôt peut aider à diagnostiquer et traiter rapidement ces défauts.

Dans des recherches récentes, une nouvelle méthode a été introduite pour améliorer la détection des souffles cardiaques grâce à des techniques d'apprentissage profond. L'objectif était de développer des outils qui peuvent classer les sons du cœur de manière efficace, aidant ainsi à un dépistage précoce des problèmes cardiaques potentiels.

C'est quoi le Dual Bayesian ResNet ?

La recherche s'est concentrée sur deux modèles principaux pour classifier les souffles cardiaques. Le premier s'appelle Dual Bayesian ResNet, ou DBRes pour faire court. Ce modèle traite les enregistrements de sons cardiaques et les décompose en plus petites parties, appelées log mel spectrograms. Ces parties sont ensuite utilisées pour déterminer si le souffle cardiaque est présent, absent ou inconnu. En faisant cela, le modèle améliore l'exactitude de la classification.

DBRes utilise une méthode où chaque son cardiaque est analysé à travers deux tâches de classification séparées : d'abord, déterminer si un souffle est présent ou non, et ensuite, déterminer si le souffle est inconnu. Les résultats de ces deux tâches sont combinés pour donner un résultat final pour chaque patient.

Comment fonctionne le modèle ?

Pour mettre en place le modèle, les chercheurs l'ont entraîné sur une variété d'enregistrements sonores. Chaque enregistrement dure quelques secondes et est associé à des Données démographiques, comme l'âge, le sexe et d'autres indicateurs de santé. En utilisant cette combinaison de données audio et d'informations démographiques, le modèle peut prendre des décisions plus éclairées.

Le modèle a été conçu pour être efficace et performant. Les chercheurs ont utilisé des techniques provenant de réseaux de neurones bayésiens, qui sont connus pour fournir non seulement des classifications mais aussi une estimation de la confiance du modèle dans ses prédictions.

Le rôle de XGBoost

Le deuxième modèle, qui s'appuie sur le premier, intègre les classifications de DBRes avec des caractéristiques supplémentaires tirées des enregistrements sonores et des données démographiques en utilisant une méthode appelée XGBoost. XGBoost est un outil puissant qui aide à améliorer la performance des modèles d'apprentissage automatique en évaluant l'importance de différentes caractéristiques de données.

Cette combinaison permet au modèle de considérer non seulement les sons cardiaques, mais aussi des informations pertinentes sur les patients, ce qui peut améliorer l'exactitude de la classification globale.

Jeu de données utilisé pour l'étude

L'étude a utilisé un jeu de données collecté dans le Nordeste du Brésil lors de deux campagnes de dépistage en 2014 et 2015. Le jeu de données comprend divers enregistrements de sons cardiaques, et chaque enregistrement peut représenter différents emplacements de valves cardiaques. En plus de ces enregistrements, des données démographiques telles que l'âge, le sexe et l'état de santé ont été collectées.

Au total, le jeu de données inclut des enregistrements pour un grand nombre de patients, avec jusqu'à six enregistrements disponibles pour chaque patient. Chaque enregistrement est étiqueté pour indiquer si un souffle est présent, absent ou inconnu. Ce jeu de données complet sert de base pour entraîner et tester les modèles.

Préparation des données

Avant de soumettre les données aux modèles, les chercheurs ont préparé les enregistrements audio en les transformant en log mel spectrograms. Ce processus consiste à mapper le contenu fréquentiel des enregistrements audio d'une manière qui met en avant la perception humaine du son.

De plus, diverses caractéristiques ont été extraites des enregistrements pour fournir un contexte supplémentaire au modèle, y compris des statistiques récapitulatives des propriétés sonores comme la fréquence et l'énergie. Cette préparation est cruciale pour garantir que les modèles puissent apprendre efficacement à partir des données.

Performance et résultats

La performance des modèles a été évaluée à l'aide de différentes métriques. L'évaluation principale portait sur la précision des modèles à classifier les souffles cardiaques. DBRes a obtenu de bons résultats, se classant quatrième dans la compétition de classification des souffles.

Cependant, lors de l'intégration des données démographiques et des caractéristiques audio avec XGBoost, une amélioration notable de la précision a été observée, mais cela a également entraîné une baisse d'une autre mesure de performance. Cela met en évidence les compromis parfois rencontrés dans la conception de modèles.

Perspectives des résultats

Les résultats suggèrent que l'utilisation de représentations spectrogrammes des sons cardiaques est bénéfique pour une classification précise. De plus, la combinaison de réseaux bayésiens et d'informations supplémentaires sur les patients joue un rôle significatif dans l'obtention de meilleurs résultats.

Il est important de noter que les modèles ont donné la priorité à la classification précise des cas où des souffles étaient présents. C'était crucial pour le défi, car la capacité à identifier correctement ces cas pourrait conduire à un diagnostic et à un traitement précoces des maladies cardiaques congénitales.

Implications pour le dépistage futur

Les approches développées dans cette étude pourraient servir de base pour de futurs outils visant à dépister les maladies cardiaques congénitales. Avec de nouvelles améliorations, notamment dans la manière dont les données démographiques sont intégrées, ces modèles ont un potentiel pour devenir une partie des dépistages de santé de routine pour les nourrissons et les enfants.

Conclusion

L'étude représente une avancée dans l'utilisation de la technologie avancée pour s'attaquer à un problème de santé significatif. Les souffles cardiaques, bien que courants, peuvent cacher de graves problèmes. En utilisant des modèles d'apprentissage profond, les chercheurs travaillent à rendre la détection précoce plus fiable.

L'intégration des données audio avec des informations démographiques peut créer un outil puissant non seulement pour la classification, mais aussi pour améliorer les résultats pour les patients. Avec la recherche et le développement en cours, la possibilité d'un dépistage non invasif et précis des défauts cardiaques pourrait bientôt devenir une réalité.

En résumé, cette recherche met en lumière le potentiel des techniques modernes d'apprentissage automatique en médecine, ouvrant la voie à des solutions innovantes pour des défis de santé traditionnels.

Source originale

Titre: Dual Bayesian ResNet: A Deep Learning Approach to Heart Murmur Detection

Résumé: This study presents our team PathToMyHeart's contribution to the George B. Moody PhysioNet Challenge 2022. Two models are implemented. The first model is a Dual Bayesian ResNet (DBRes), where each patient's recording is segmented into overlapping log mel spectrograms. These undergo two binary classifications: present versus unknown or absent, and unknown versus present or absent. The classifications are aggregated to give a patient's final classification. The second model is the output of DBRes integrated with demographic data and signal features using XGBoost.DBRes achieved our best weighted accuracy of $0.771$ on the hidden test set for murmur classification, which placed us fourth for the murmur task. (On the clinical outcome task, which we neglected, we scored 17th with costs of $12637$.) On our held-out subset of the training set, integrating the demographic data and signal features improved DBRes's accuracy from $0.762$ to $0.820$. However, this decreased DBRes's weighted accuracy from $0.780$ to $0.749$. Our results demonstrate that log mel spectrograms are an effective representation of heart sound recordings, Bayesian networks provide strong supervised classification performance, and treating the ternary classification as two binary classifications increases performance on the weighted accuracy.

Auteurs: Benjamin Walker, Felix Krones, Ivan Kiskin, Guy Parsons, Terry Lyons, Adam Mahdi

Dernière mise à jour: 2023-05-26 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2305.16691

Source PDF: https://arxiv.org/pdf/2305.16691

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires