Simple Science

La science de pointe expliquée simplement

# Génie électrique et science des systèmes# Traitement de l'image et de la vidéo# Vision par ordinateur et reconnaissance des formes# Apprentissage automatique

Améliorer la mesure de la tête fœtale avec l'IA

Des recherches montrent que l'IA peut améliorer la précision des mesures de la circonférence de la tête du fœtus.

― 7 min lire


L'IA améliore les mesuresL'IA améliore les mesuresfœtales.tête fœtale.évaluations de la circonférence de laL'IA améliore la précision des
Table des matières

Mesurer la taille de la tête d'un fœtus pendant la grossesse est super important pour suivre sa croissance. Cette mesure, appelée circonférence crânienne (CC), aide les médecins à s'assurer que tout se développe comme il faut. Traditionnellement, ça se fait par des échographistes experts, mais c'est souvent lent et ça peut mener à des erreurs.

Pour rendre ce processus plus rapide et précis, certains chercheurs utilisent la technologie informatique. Une approche consiste à utiliser une intelligence artificielle appelée Réseau Neuronal Convolutif (CNN). Construire ces CNN de A à Z peut être galère car ça demande beaucoup de données et de temps.

Une meilleure solution, c’est d’utiliser une méthode appelée Apprentissage par transfert (TL). Ça consiste à prendre un modèle déjà entraîné sur un gros dataset et à l’adapter pour une nouvelle tâche. Dans notre cas, on a bossé sur l'amélioration du modèle U-Net-une structure établie pour segmenter des images-en utilisant une version plus légère d’un réseau appelé MobileNet comme base pour analyser des images d’échographie de tête fœtale.

Importance de l'Apprentissage par Transfert

L'apprentissage par transfert est particulièrement utile dans le domaine médical où les données sont souvent limitées. Dans cette étude, on a affiné un modèle U-Net pré-entraîné pour qu'il fonctionne spécifiquement avec un dataset d’images d’échographie de tête fœtale. Ça nous a permis d’obtenir de bons résultats en utilisant bien moins de ressources que si on partait de zéro.

Aperçu de l'Étude

On a analysé un dataset d’images d’échographie contenant environ 1 334 images de 551 femmes enceintes. Ces images étaient divisées en deux groupes : un pour entraîner notre modèle et l’autre pour tester son efficacité. Notre objectif était de segmenter les images, c’est-à-dire identifier et délimiter la forme de la tête fœtale sur ces photos.

On a modifié le modèle U-Net en ajoutant l’encodeur MobileNet V2. Cette combinaison nous a permis de créer un modèle léger qui fonctionne bien tout en nécessitant moins de ressources.

Stratégies de Fine-tuning

On a testé huit méthodes différentes pour affiner le modèle U-Net avec l'encodeur MobileNet. Le fine-tuning peut impliquer d’ajuster différentes parties du modèle pendant l’entraînement pour l’aider à mieux apprendre. On a exploré plusieurs options, comme ne pas changer certaines couches pendant l’entraînement, pour voir comment ça influençait le résultat.

Nos résultats ont montré que la méthode la plus efficace était d’ajuster tout le décodeur. Ça a entraîné des améliorations significatives dans la prédiction des formes de tête fœtale par rapport à l’utilisation du modèle U-Net de base ou d’autres stratégies d’ajustement.

Travaux Connexes

Avant l’arrivée de méthodes IA sophistiquées, les experts s'appuyaient sur des mesures manuelles, ce qui pouvait conduire à des erreurs à cause des variations de compétences des opérateurs. Récemment, les avancées en deep learning ont fourni des outils qui réalisent ces mesures de manière plus précise.

Le modèle U-Net initial a été spécifiquement conçu pour la segmentation d’images médicales. Il existe des modèles plus récents, comme MobileNet, qui sont légers et efficaces, idéaux pour les appareils avec une puissance de calcul limitée.

Des recherches ont montré que l’utilisation de modèles pré-entraînés peut souvent mener à de meilleurs résultats. D'autres études ont tenté différentes méthodes d’apprentissage par transfert mais nécessitaient plus de paramètres entraînables, rendant leurs solutions plus lourdes.

Préparation des Données

Pour notre étude, on a utilisé le dataset HC18, qui consiste en des images d’échographie spécifiquement destinées à mesurer la circonférence de la tête fœtale. Sur le total d’images, 999 étaient destinées à l’entraînement, et 335 à des tests. Toutes les images ont été redimensionnées pour être cohérentes, et des techniques standard ont été appliquées pour augmenter les données, aidant le modèle à apprendre sous différents angles et conditions.

Conception du Modèle

On a conçu un modèle U-Net avec quatre couches pour l'encodage et le décodage. La base de notre U-Net utilisait le modèle MobileNet V2, qui avait déjà été entraîné sur un autre dataset. Comme ça, on pouvait s’appuyer sur l’apprentissage qui avait déjà eu lieu, sans partir de zéro.

Méthodes de Fine-tuning

Nos processus de fine-tuning incluaient différentes stratégies. Le modèle de base avait toutes ses couches dégelées, c’est-à-dire qu'il était entièrement entraîné. On a aussi testé divers niveaux de gel des couches pour voir comment l'ajustement des couches entraînées influençait les performances. La performance de chaque méthode a été testée plusieurs fois pour garantir la cohérence des résultats.

Entraînement et Évaluation

Tous les expérimentations ont été réalisées avec un cadre d’apprentissage automatique appelé Pytorch. On a entraîné notre modèle U-Net pendant un certain nombre d'époques, chaque cycle d’entraînement prenant un certain temps. Pour la version MobileNet, l’entraînement était plus rapide grâce à la pré-formation et à moins de paramètres.

Les méthodes fréquemment utilisées pour évaluer les modèles incluaient la mesure de la Précision des pixels (combien de pixels étaient correctement identifiés), le Score de Dice (une mesure de superposition), et l'Intersection sur l'Union Moyenne (IoU). Ces métriques donnent une idée de la performance du modèle en termes de segmentation des images.

Résultats

Les résultats ont révélé que dégelé tout le décodeur a contribué à une meilleure précision. Notre modèle affiné a montré des améliorations en précision par rapport au modèle de base. On a réussi à réduire le nombre de paramètres de manière significative tout en maintenant une performance élevée.

Bien que notre méthode ait bien fonctionné, quelques défis subsistaient, surtout avec les images d’échographie ayant des contours flous. Ça a montré que même si le modèle pouvait bien faire, il avait parfois du mal dans des conditions moins idéales.

Conclusion

En résumé, notre étude a montré que le fine-tuning d'un modèle U-Net pré-entraîné pouvait aider à segmenter avec précision les images de tête fœtale à partir d’échographies tout en gardant le modèle léger.

Nos résultats ont souligné que l'utilisation de modèles préexistants pouvait améliorer l'exactitude et l'efficacité, rendant l'analyse d'images médicales plus accessible et fiable. Il est important de noter qu’il est possible d’obtenir des résultats compétitifs avec une fraction des paramètres normalement nécessaires pour des tâches similaires.

Travaux Futurs

Pour l'avenir, on va se concentrer sur la réduction du bruit dans les images d'échographie en utilisant des techniques de traitement d'images. On va aussi explorer la résilience des modèles entraînés avec différentes stratégies. De plus, examiner d'autres modèles pré-entraînés pourrait aider à réduire encore la taille du modèle tout en maintenant ou en améliorant la performance.

À long terme, ces avancées visent à améliorer la façon dont l'analyse des images médicales est effectuée, la rendant plus rapide et plus précise pour les professionnels de la santé.

Source originale

Titre: Evaluate Fine-tuning Strategies for Fetal Head Ultrasound Image Segmentation with U-Net

Résumé: Fetal head segmentation is a crucial step in measuring the fetal head circumference (HC) during gestation, an important biometric in obstetrics for monitoring fetal growth. However, manual biometry generation is time-consuming and results in inconsistent accuracy. To address this issue, convolutional neural network (CNN) models have been utilized to improve the efficiency of medical biometry. But training a CNN network from scratch is a challenging task, we proposed a Transfer Learning (TL) method. Our approach involves fine-tuning (FT) a U-Net network with a lightweight MobileNet as the encoder to perform segmentation on a set of fetal head ultrasound (US) images with limited effort. This method addresses the challenges associated with training a CNN network from scratch. It suggests that our proposed FT strategy yields segmentation performance that is comparable when trained with a reduced number of parameters by 85.8%. And our proposed FT strategy outperforms other strategies with smaller trainable parameter sizes below 4.4 million. Thus, we contend that it can serve as a dependable FT approach for reducing the size of models in medical image analysis. Our key findings highlight the importance of the balance between model performance and size in developing Artificial Intelligence (AI) applications by TL methods. Code is available at https://github.com/13204942/FT_Methods_for_Fetal_Head_Segmentation.

Auteurs: Fangyijie Wang, Guénolé Silvestre, Kathleen M. Curran

Dernière mise à jour: 2024-08-01 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2307.09067

Source PDF: https://arxiv.org/pdf/2307.09067

Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires