Simple Science

La science de pointe expliquée simplement

# Génie électrique et science des systèmes# Traitement de l'image et de la vidéo

Le rôle de l'IA en radiologie : faire face aux pénuries de personnel

Explorer des solutions d'IA pour résoudre la pénurie de radiologues et améliorer les soins aux patients.

― 12 min lire


IA en radiologie : unIA en radiologie : untravail en coursavec les tâches cliniques complexes.L'IA montre du potentiel mais galère
Table des matières

Il y a une pénurie croissante de radiologues dans le monde. Cette pénurie entraîne des retards dans les traitements et augmente le stress des travailleurs de la santé, ce qui peut mettre les patients en danger. Utiliser l'intelligence artificielle (IA) pour aider à lire les images médicales et rédiger des rapports pourrait aider à atténuer certains de ces problèmes. Cependant, il n'y a toujours pas assez de recherches sur la façon de créer automatiquement des descriptions qui sonnent naturellement pour les images médicales en 3D comme les scanners CT.

Cette étude présente un modèle de base qui utilise l'Apprentissage profond pour détecter les problèmes dans les scanners CT en 3D et rédiger des rapports connexes dans un style narratif. Le modèle a été testé en utilisant différents types de structures d’IA pour voir comment elles pouvaient gérer à la fois des tâches médicales significatives et des tâches plus faciles. Les tâches médicales principales se concentraient sur la détection et la description des nodules pulmonaires et de l'accumulation de liquide dans les poumons. Les tâches plus faciles consistaient à reconnaître des changements artificiels dans les images, comme des retournements ou des rotations.

Les résultats ont montré un haut degré de précision dans l'identification des changements artificiels, le meilleur modèle atteignant une précision de 97 % sur un ensemble de test séparé. De plus, ce modèle a été capable de produire des rapports compréhensibles avec un bon taux de prédiction pour le prochain mot dans une phrase. Cependant, il a eu du mal avec les tâches médicales principales.

Dans l'ensemble, cette étude présente un modèle fonctionnel qui aborde un domaine qui n'a pas été largement exploré dans la recherche. Le succès montré dans les tâches plus faciles suggère qu'il y a un potentiel pour réussir dans les tâches principales avec un développement supplémentaire, surtout si des ensembles de données plus grands et de meilleure qualité sont utilisés.

Le besoin d'IA en radiologie

Au Royaume-Uni, un rapport a souligné un manque de 29 % de radiologues, et cette tendance devrait croître. De nombreux directeurs de centres de cancer craignent que cette pénurie ne nuise à la sécurité des patients en raison de retards dans les traitements et du potentiel d'erreurs causées par un personnel stressé. Alors que les radiologues sont débordés de travail, le moral et le bien-être du personnel en souffrent aussi. Ces problèmes se reflètent dans de nombreux pays.

Pour relever ces défis et garantir un avenir durable pour la main-d'œuvre en radiologie, l'intégration de l'intelligence artificielle est perçue comme une étape bénéfique. L'IA peut aider en automatisant partiellement l'analyse des images radiographiques. Cela pourrait alléger la charge de travail des radiologues, réduire les délais dans les soins aux patients et diminuer les chances d'erreurs humaines, améliorant ainsi les résultats pour les patients. De plus, l'utilisation de l'IA pourrait aider à standardiser les processus, entraînant ainsi des coûts moindres.

Le domaine de l'IA pour l'analyse des images médicales a pris de l'ampleur après qu'un modèle d'apprentissage profond appelé AlexNet a bien performé lors d'une grande compétition de reconnaissance d'images en 2012. Depuis lors, l'apprentissage profond, en particulier les réseaux de neurones convolutifs (CNN), est devenu essentiel dans l'Analyse d'images en radiologie.

Malgré l'accent mis sur l'analyse d'images, ce n'est qu'une partie de ce que font les radiologues. Après avoir analysé les images, ils doivent transmettre leurs résultats dans des rapports détaillés pour d'autres professionnels de la santé. Ces rapports peuvent être structurés, suivant un modèle prédéfini avec des réponses limitées, ou dans un style narratif, ce qui permet des descriptions plus larges et flexibles.

La recherche sur la génération de rapports de radiologie au style narratif est encore relativement nouvelle. Cela est en partie dû aux techniques complexes de traitement du langage naturel (NLP) nécessaires pour générer de plus longs morceaux de texte. Les premières architectures notables pour générer des séquences plus longues étaient des réseaux de neurones récurrents (RNN), mais des avancées comme l'architecture de transformateur depuis 2017 ont considérablement amélioré la capacité à créer des morceaux de texte cohérents.

Une grande partie de l'attention dans la génération de rapports narratifs s'est concentrée sur les images 2D, et il y a peu de recherches sur la création de rapports à partir d'images 3D. Cette étude vise à combler cette lacune en travaillant sur la génération de rapports au style narratif à partir des images CT.

Objectifs de l'étude

Cette étude vise à développer un outil d'IA de base capable d'identifier des problèmes dans les images CT en 3D et de produire des rapports compréhensibles décrivant ces problèmes. L'objectif principal est de montrer ce qui peut être réalisé avec des ressources limitées et d'identifier les principaux défis dans ce domaine de recherche.

Comme il s'agit d'un travail exploratoire, le modèle utilisera des anomalies artificielles pour créer un ensemble de données plus équilibré et plus facile à apprendre pour le modèle. Ces images artificielles peuvent être moins compliquées à reconnaître que des problèmes cliniques réels. Cependant, des efforts seront également faits pour appliquer cette approche à des cas médicaux réels.

Le but ultime est de créer un modèle capable de détecter des anomalies dans les images CT en 3D et de générer des rapports narratifs précis. Cet objectif semble réalisable sur la base des études existantes qui se concentrent sur des images 2D, de modèles ayant employé avec succès des CNN pour identifier diverses maladies dans l'imagerie 3D, et d'avancées récentes dans les grands modèles de langage, qui montrent des promesses dans la génération de texte cohérent.

Vue d'ensemble technique

La génération automatique de rapports de radiologie est similaire à la génération de légendes pour les images. Le domaine moderne de la légende d'image automatique a décollé après la publication d'un article en 2015 qui a introduit un CNN pour traiter les images, suivi d'un RNN qui a créé une description en langage naturel. Les CNN fonctionnent bien pour la compression d'image car ils peuvent capturer des caractéristiques essentielles tout en réduisant la taille de l'image grâce à des couches convolutives.

Dans le décodeur, les mots d'un rapport sont générés un par un en fonction des données de l'image. Le modèle utilise des probabilités pour déterminer quel mot vient ensuite. Ce processus continue jusqu'à ce que le rapport soit complet.

Pour cette étude, une approche encodeur-décodeur est utilisée, où l'encodeur se concentre sur la reconnaissance des caractéristiques des images CT, et le décodeur génère des rapports basés sur ces informations. L'encodeur utilise un CNN, suivi d'un classificateur, tandis que le décodeur utilise un modèle basé sur des transformateurs pour créer les rapports.

Entraîner les modèles présente des défis, surtout en ce qui concerne la collecte d'un ensemble de données suffisamment grand. Étant donné que les données médicales sont sensibles et soumises à des lois sur la confidentialité, acquérir une grande quantité de données 3D pour l'entraînement peut être complexe. De plus, la mémoire et la puissance de calcul nécessaires pour traiter les données volumétriques sont considérables.

Collecte de données

Un ensemble de données robuste de scanners CT volumétriques est crucial pour cette étude. Malheureusement, les ensembles de données disponibles publiquement qui répondent à ces exigences sont rares. Par conséquent, l'ensemble de données utilisé dans cette étude a été obtenu d'un centre médical prêt à partager ses données.

L'ensemble de données est constitué d'images et de rapports de patients diagnostiqués avec un mélanome. Les scanners CT ont principalement été utilisés pour détecter une éventuelle propagation du cancer. Cet ensemble de données comprend des images et des rapports collectés dans huit hôpitaux différents, ce qui introduit une variabilité due à différents protocoles d'imagerie et formats de rapport.

Les images brutes ont nécessité un prétraitement pour les préparer au modèle encodeur. Cela incluait la standardisation de l'orientation des images et la segmentation des poumons pour se concentrer sur la zone d'intérêt. Après le prétraitement, un total de 464 images restait, réparties en ensembles d'entraînement, de validation et de test.

Tâches de remplacement

L'étude a également utilisé des "tâches de remplacement", qui sont des tâches plus simples partageant des similitudes avec les objectifs principaux. En entraînant l'IA sur ces tâches plus faciles, les chances de créer un concept fonctionnel viable sont plus élevées.

Les tâches de remplacement consistaient à créer des anomalies artificielles comme des retournements, des rotations et des occlusions de lobes pulmonaires. Chacune de ces tâches a été conçue pour être plus simple à reconnaître pour le modèle. Les rapports générés pour ces anomalies utilisaient des phrases prédéfinies pour décrire ce qui s'était passé.

Développement du modèle

Le projet impliquait l'utilisation de deux parties : l'encodeur, qui identifiait les caractéristiques dans les images, et le décodeur, qui générait des rapports basés sur la sortie de l'encodeur. Les différents modèles évalués comprenaient divers CNN pour la partie encodeur et différentes architectures de transformeurs pour le décodeur.

Les performances du modèle ont été évaluées en fonction de sa capacité à classifier les tâches de remplacement et à générer des rapports significatifs. L'étude visait à trouver les meilleures combinaisons de performances qui pourraient servir de base pour de futures recherches dans ce domaine.

Résultats

Les résultats ont montré de fortes performances dans la reconnaissance des anomalies artificielles. Le meilleur modèle a atteint une précision de classification de 97 % lorsqu'il a été testé sur un ensemble de données comprenant diverses modifications artificielles. L'IA a également été capable de produire des rapports compréhensibles, avec une grande précision de prédiction pour le prochain mot dans la phrase.

Cependant, le modèle a eu du mal avec les tâches cliniques principales de détection des anomalies liées au cancer, comme les nodules pulmonaires et l'accumulation de liquide. Aucun des modèles d'encodeur n'a réussi à performer mieux qu'une simple supposition au hasard sur ces tâches importantes, ce qui indique la nécessité de travaux supplémentaires et de ressources pour relever ces défis.

En résumé, cette étude a démontré que les modèles d'IA peuvent bien fonctionner sur des tâches plus faciles mais rencontrent des difficultés dans des scénarios cliniques plus complexes. Les résultats soulignent le potentiel de recherches supplémentaires pour combler cette lacune et améliorer la capacité à reconnaître et décrire les images médicales avec précision.

Discussion

Les résultats de ce travail soulignent l'importance de poursuivre les applications de l'IA en radiologie, en particulier dans la génération de rapports narratifs basés sur des images CT. Bien qu'il y ait eu des résultats prometteurs avec des anomalies artificielles, les défis rencontrés pour détecter des problèmes cliniquement pertinents montrent que ce domaine a encore beaucoup de marge de progression.

L'étude illustre que, bien que l'IA puisse aider les radiologues, surtout dans le contexte actuel de pénurie de main-d'œuvre, des défis tels que des ensembles de données limités et la complexité des anomalies du monde réel doivent être surmontés. De meilleurs ensembles de données, combinés à des ressources informatiques améliorées, sont essentiels pour les avancées futures dans ce domaine.

Une autre piste à considérer est l'expansion possible de cette recherche dans d'autres domaines, comme le soutien aux personnes ayant des déficiences visuelles ou l'amélioration de l'efficacité de l'analyse des images de surveillance. Les outils et méthodologies développés dans cette étude pourraient s'appliquer à divers domaines au-delà de la radiologie.

En conclusion, bien que cette étude ait atteint une preuve de concept fonctionnelle pour automatiser la reconnaissance des anomalies dans les images CT en 3D et générer des rapports connexes, il est clair qu'il est nécessaire de mener davantage de recherches et d'investir des ressources pour améliorer l'efficacité des modèles d'IA dans les contextes cliniques. Le cadre développé dans cette étude constitue une ressource pour de futures recherches, fournissant une base sur laquelle d'autres investigations peuvent être bâties.

Source originale

Titre: Automatically Generating Narrative-Style Radiology Reports from Volumetric CT Images; a Proof of Concept

Résumé: The world faces a shortage of radiologists, leading to longer treatment times and increased stress, negatively impacting patient safety and workforce morale. Integrating artificial intelligence to interpret radiographic images and generate descriptive reports offers a promising solution. However, limited research exists on generating natural language descriptions for volumetric medical images. This study introduces a deep learning-based proof of concept model to accurately identify abnormalities in volumetric CT data and generate narrative-style reports. Various encoder-decoder models were assessed for their efficacy in clinically relevant and surrogate tasks. Clinically relevant tasks involved identifying and describing pulmonary nodules and pleural effusions, while surrogate tasks involved recognizing and describing artificial abnormalities such as mirroring, rotation, and lung lobe occlusion. The results show high accuracy in detecting combinations of artificial abnormalities, with the best model achieving a classification accuracy of 0.97 on an independent dataset with a homogeneously distributed 11-class problem. Furthermore, the best model consistently generated coherent radiology reports in natural language, with a next-word prediction accuracy of 0.84. Additionally, 65% of these reports were factually accurate regarding the identified artificial abnormalities. Unfortunately, these models did not replicate this success for clinically relevant tasks. Overall, this study provides a working proof of concept model for a challenge yet to be fully addressed by the scientific community. Given the success on surrogate tasks, the leap to clinically relevant tasks seems feasible. Acquiring a significantly larger high-quality dataset appears to be the most promising path forward, alongside more computational resources for end-to-end model training.

Auteurs: Marijn Borghouts

Dernière mise à jour: 2024-06-18 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2406.12599

Source PDF: https://arxiv.org/pdf/2406.12599

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires