Transformer la classification de la rétinopathie diabétique avec DR-GPT
DR-GPT améliore la classification de la rétinopathie diabétique en utilisant des rapports médicaux non structurés.
― 8 min lire
Table des matières
La Rétinopathie diabétique (RD) est une condition qui menace la vision et qui survient à cause du diabète. Quand une personne a du diabète, son taux de sucre dans le sang peut augmenter. Avec le temps, ça peut abîmer les yeux, menant à la RD. Les docteurs, appelés ophtalmologistes, cherchent des signes de RD lors des examens. Ils examinent les yeux et notent leurs observations, ce qui aide à Classer la gravité de la maladie.
En Finlande, les médecins et les photographes enregistrent des observations sur la santé des yeux dans des dossiers de santé électroniques. Ces dossiers peuvent être désorganisés, ce qui les rend difficiles à interpréter pour une analyse plus poussée. Pour que les chercheurs et les professionnels de la santé puissent analyser précisément les Données sur la RD, une classification claire est essentielle. Cependant, passer en revue des milliers de Rapports de patients à la main prend beaucoup de temps et peut être souvent peu pratique.
L'essor des modèles linguistiques
Ces dernières années, les grands modèles linguistiques (GML) sont devenus populaires, surtout avec des applis de chat comme ChatGPT, Llama et Bard. Ces outils puissants peuvent lire et comprendre du texte, ce qui les rend utiles dans plein de domaines, y compris la santé. Ils peuvent extraire des infos importantes des textes médicaux, aidant à des tâches comme prédire des codes de maladie et diagnostiquer des conditions à partir de rapports de patients. Vu leurs capacités, les GML offrent un potentiel pour déterminer automatiquement les classifications de RD à partir de dossiers de santé désordonnés.
Présentation de DR-GPT
Dans notre recherche, on a créé un modèle de langue finlandais nommé DR-GPT. Ce système vise à étiqueter automatiquement la gravité de la rétinopathie diabétique en analysant des rapports de texte non structurés des médecins. On a fait des évaluations pour mesurer l’efficacité de DR-GPT pour classifier la RD et voir comment ça aide à créer des données qui peuvent entraîner d'autres systèmes d'IA utilisés pour analyser des Images médicales.
Collecte des données des patients
Notre étude s'est concentrée sur les données collectées auprès des patients à l'hôpital universitaire d'Helsinki entre 2016 et 2019. On a examiné un ensemble de données contenant plus de 40 000 rapports de plus de 31 000 patients diabétiques. Chaque patient avait des images de ses yeux, et les médecins rédigeaient des rapports détaillant des constats comme la gravité de la RD.
Selon la loi finlandaise, on n’avait pas besoin de permission ou de consentement des patients pour ce type d'étude puisque ça concernait des données non identifiables. Des professionnels formés ont examiné plusieurs rapports pour classifier la gravité de la RD selon un système de notation commun.
Préparation des données
Avant d'analyser les rapports, il a fallu nettoyer et préparer les données textuelles. Les rapports médicaux peuvent contenir des infos inutiles, comme des horodatages et des noms d’examinateurs. On a enlevé ce contenu superflu pour se concentrer uniquement sur ce qui était pertinent pour l'état du patient. Ensuite, on a converti le texte nettoyé dans un format adapté à l'analyse de DR-GPT.
On a aussi utilisé des images des yeux des patients pour aider à entraîner un système à reconnaître la RD. Lors d'une visite standard, environ quatre images de chaque œil étaient prises. Cependant, certaines visites ont donné des nombres d'images différents, donc on s'est concentré sur celles avec les quatre images standard pour simplifier notre analyse.
Comment fonctionne DR-GPT
DR-GPT utilise un modèle linguistique spécialement conçu pour interpréter le texte finlandais. Ce modèle analyse les rapports et prédit la gravité de la rétinopathie diabétique en fonction de ce qu'il apprend du texte. On a entraîné DR-GPT en ajustant son architecture pour gérer à la fois la notation de la RD et la gradabilité de la condition.
Quand on a utilisé DR-GPT pour classifier la gravité de la RD, il a produit deux ensembles de résultats pour chaque œil en fonction des infos fournies dans les rapports.
Évaluation des performances
On a testé la capacité de DR-GPT à classifier la RD en utilisant diverses mesures, y compris la précision et la capacité à s'accorder avec les classifications humaines. Lors de l'évaluation des performances, on a constaté que DR-GPT performait exceptionnellement bien, atteignant des scores élevés tant pour classifier la gravité de la RD que pour déterminer si les cas étaient gradables ou non.
Cependant, on a remarqué que lorsque la même évaluation était faite sur un ensemble de rapports avec uniquement du contenu unique, la performance diminuait légèrement. Cette observation a mis en évidence le défi que peuvent représenter les rapports plus simples et répétitifs pour les tâches de classification.
Expérience de classification d'images
Pour la deuxième partie de notre étude, on a examiné à quel point les images des yeux des patients pouvaient être classées en utilisant un modèle différent appelé EfficientNet-B6. Au départ, ce modèle a été entraîné uniquement avec des données étiquetées manuellement. Ensuite, on a complété ces données avec des annotations faibles générées par DR-GPT.
Les résultats ont montré qu'ajouter les annotations faibles de DR-GPT a amélioré la performance du modèle de classification d'images. Cette découverte indique que DR-GPT peut effectivement aider à générer des données d'entraînement pour d'autres systèmes d'IA, améliorant leur performance.
Résultats de l'étude
En résumé, DR-GPT a montré une précision impressionnante en classifiant à la fois les rapports textuels et les images médicales. Le système a pu analyser les notes des médecins et déterminer avec précision la gravité de la rétinopathie diabétique. Il a également aidé à créer des données faiblement étiquetées, ce qui a amélioré la performance d'un modèle de classification d'images.
Bien que le modèle DR-GPT ait excellé, on a reconnu que certains facteurs pouvaient affecter ses performances. La présence de rapports dupliqués ou trop simples dans l'ensemble de données d'évaluation a suggéré que le modèle pourrait bénéficier d'un éventail de cas plus diversifié.
Limitations et travaux futurs
Notre étude a fait face à plusieurs limitations. Une limitation majeure était que DR-GPT a été entraîné sur des données provenant d'un seul hôpital en Finlande. Cela signifie que les résultats pourraient ne pas s'appliquer aussi bien à d'autres régions où les rapports pourraient être différents. Pour remédier à cela, des travaux futurs pourraient impliquer la collecte de données de plusieurs centres pour voir comment DR-GPT fonctionne dans divers contextes.
Une autre limitation était que certains rapports faisaient référence à des examens antérieurs qui n'étaient pas disponibles pour l’analyse de DR-GPT. Améliorer le système pour utiliser ces données historiques pourrait améliorer ses performances. De plus, on a utilisé un système de notation simplifié qui peut ne pas capturer tous les aspects de la rétinopathie diabétique, limitant notre capacité à effectuer des analyses plus fines de la condition.
Enfin, bien que notre méthode de classification d'images ait été efficace, on a utilisé une approche basique pour combiner plusieurs images. Des recherches futures pourraient permettre d'utiliser des techniques plus avancées pour mieux analyser les données.
Conclusion
Cette étude a souligné comment les grands modèles linguistiques comme DR-GPT peuvent analyser des rapports médicaux non structurés pour déterminer avec précision la gravité de la rétinopathie diabétique. En utilisant ce modèle, les professionnels de la santé pourraient générer automatiquement des classifications de RD et fournir des données d'entraînement précieuses pour d'autres systèmes analytiques.
Dans l'ensemble, la haute précision atteinte par DR-GPT montre un grand potentiel pour améliorer les processus de dépistage de la rétinopathie diabétique. Améliorer cette méthode avec des données plus variées et des méthodologies avancées sera une étape essentielle pour les recherches futures.
Titre: DR-GPT: a large language model for medical report analysis of diabetic retinopathy patients
Résumé: Diabetic retinopathy (DR) is a sight-threatening condition caused by diabetes. Screening programmes for DR include eye examinations, where the patients fundi are photographed, and the findings, including DR severity, are recorded in the medical report. However, statistical analyses based on DR severity require structured labels that calls for laborious manual annotation process if the report format is unstructured. In this work, we propose a large language model DR-GPT for classification of the DR severity from unstructured medical reports. On a clinical set of medical reports, DR-GPT reaches 0.975 quadratic weighted Cohens kappa using truncated Early Treatment Diabetic Retinopathy Study scale. When DR-GPT annotations for unlabeled data are paired with corresponding fundus images, the additional data improves image classifier performance with statistical significance. Our analysis shows that large language models can be applied for unstructured medical report databases to classify diabetic retinopathy with a variety of applications.
Auteurs: Kimmo Kaski, J. Jaskari, J. Sahlsten, P. Summanen, J. Moilanen, E. Lehtola, M. Aho, E. Säpyskä, K. Hietala
Dernière mise à jour: 2024-01-17 00:00:00
Langue: English
Source URL: https://www.medrxiv.org/content/10.1101/2024.01.12.24301230
Source PDF: https://www.medrxiv.org/content/10.1101/2024.01.12.24301230.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.