Progrès dans les données de soins oculaires en Amérique Latine
Nouveau jeu de données améliore la compréhension des maladies oculaires en Amérique Latine.
― 6 min lire
Table des matières
- Manque de données ouvertes en Amérique Latine
- L'ensemble de données BRSET
- Sources de données
- Collecte de données
- Préparation de l'ensemble de données
- Contrôle de qualité
- Classification des conditions oculaires
- Enregistrements de données
- Stockage des données
- Analyse descriptive
- Évaluation de la qualité
- Applications de recherche
- Métriques de performance
- Directions futures
- Conclusion
- Source originale
- Liens de référence
Dans le domaine des soins oculaires, l'imagerie joue un rôle essentiel pour diagnostiquer et surveiller diverses conditions oculaires. Des techniques comme les photos du fond de l'œil (photos du fond rétinien), les photos de l'avant de l'œil et les tests des champs visuels sont couramment utilisées. La nouvelle technologie, surtout l'intelligence artificielle (IA), a le potentiel d'améliorer les soins pour les maladies oculaires. L'IA peut aider aux dépistages et aux diagnostics, surtout dans les zones manquant de ressources. C'est crucial pour des conditions comme la Rétinopathie diabétique, la dégénérescence maculaire liée à l'âge et le glaucome. Cependant, il y a des inquiétudes que l'IA puisse être injuste si elle se base sur des données non représentatives.
Manque de données ouvertes en Amérique Latine
Le mouvement de la science ouverte, qui encourage le partage des données et des recherches, n'a pas beaucoup progressé en Amérique Latine, surtout dans les soins oculaires. La plupart des ensembles de données disponibles proviennent de pays riches, ce qui ne reflète pas la situation dans les zones à faibles revenus. Ces ensembles de données manquent souvent d'informations démographiques et de santé importantes, les rendant moins utiles pour comprendre les maladies oculaires dans différentes populations. Dans beaucoup de ces pays, il n'y a pas assez de médecins ophtalmologistes pour le nombre de personnes ayant besoin de soins. Bien que des systèmes automatisés pourraient aider à atteindre plus de patients et réduire la cécité évitable, il est crucial d'avoir des données qui représentent précisément ceux les plus touchés par ces maladies.
L'ensemble de données BRSET
Un effort important pour aborder ces problèmes est la création de l'ensemble de données BRSET, qui est le premier ensemble de données ophtalmologiques en libre accès d'Amérique Latine. Cet ensemble comprend une variété d'informations sur les maladies oculaires et différents milieux sociaux. L'ensemble a été approuvé par un comité d'éthique de la recherche et inclut des photos du fond de l'œil ainsi que des données cliniques. Toutes les informations identifiables concernant les patients ont été supprimées pour protéger la vie privée.
Sources de données
Les données sont collectées dans trois centres de soins oculaires de São Paulo, au Brésil, sur une période de 2010 à 2020. Les photos ont été prises avec divers appareils rétiniens par du personnel formé.
Collecte de données
Les photos de l'ensemble de données ont été capturées avec différents types de caméras rétiniennes. Les membres du personnel ont pris ces photos après avoir administré un médicament pour dilater les pupilles. Cela garantit des images plus claires. Chaque photo a été vérifiée pour s'assurer qu'aucune information privée n'est incluse.
Préparation de l'ensemble de données
Chaque photo est étiquetée avec des détails sur l'appareil utilisé, le centre de l'image, la nationalité du patient, son âge, son sexe, ses conditions de santé, son utilisation d'insuline et depuis combien de temps il a le diabète. Ces détails ont été recueillis à partir des dossiers de santé électroniques des patients. Un ophtalmologiste spécialiste a étiqueté les images selon des critères convenus.
Contrôle de qualité
Pour assurer une haute qualité, des facteurs tels que la mise au point, l'éclairage, la zone de l'image et les artefacts inhabituels dans les images ont été évalués. Si la qualité n'était pas satisfaisante, cela était noté et classé en conséquence.
Classification des conditions oculaires
L'ensemble de données comprend également des classifications de diverses maladies oculaires telles que la rétinopathie diabétique, l'Œdème maculaire, et d'autres. La rétinopathie diabétique a été classée en utilisant des systèmes de graduation standard.
Enregistrements de données
L'ensemble de données BRSET contient 16 266 images de 8 524 patients au Brésil, ainsi qu'un fichier décrivant toutes les étiquettes et détails.
Stockage des données
Les images et leurs étiquettes sont stockées dans un référentiel public pour que d'autres puissent y accéder.
Analyse descriptive
Dans l'ensemble de données BRSET, la plupart des images (environ 65 %) ont été prises avec un type de caméra rétinienne. Une plus grande partie des patients dans l'ensemble de données sont des femmes. L'âge moyen des patients est d'environ 57 ans.
Parmi les patients, un certain nombre ont été diagnostiqués avec le diabète. La majorité n'avait aucun signe de rétinopathie diabétique, tandis que d'autres avaient des stades variés de la maladie. Il y a aussi des images montrant des différences dans l'anatomie de l'œil parmi les patients.
Évaluation de la qualité
Concernant la qualité des images, un petit pourcentage a été trouvé avec des problèmes de mise au point, d'éclairage ou d'autres facteurs de qualité. Les métadonnées associées aux images avaient également peu de données manquantes, ce qui assure la fiabilité de l'ensemble de données.
Applications de recherche
L'ensemble de données BRSET peut être utilisé pour développer des modèles de vision par ordinateur. Ces modèles peuvent identifier les caractéristiques des patients et classifier les maladies. L'ensemble soutient diverses tâches, y compris le diagnostic du diabète et la classification du sexe basé sur les images.
Métriques de performance
Trois tâches principales ont été réalisées en utilisant cet ensemble de données : déterminer si le patient a le diabète, définir son sexe et évaluer la rétinopathie diabétique. Différents modèles ont été utilisés pour ces tâches et ont été évalués en fonction de leurs performances.
Directions futures
L'ensemble de données BRSET est une contribution significative au domaine de l'ophtalmologie au Brésil et en Amérique Latine. Il vise à améliorer la représentation des données et à créer un cadre pour développer d'autres ensembles de données à l'avenir. L'ensemble souligne également la nécessité d'examiner si les algorithmes utilisés dans les milieux médicaux sont équitables entre différents groupes démographiques.
Conclusion
L'ensemble de données BRSET ouvre de nouvelles perspectives pour la recherche et les soins en santé oculaire. Il permet une meilleure compréhension des maladies qui touchent beaucoup de gens, notamment en Amérique Latine. En ayant un ensemble de données qui représente des populations diverses, il devient possible de créer des systèmes d'IA plus efficaces et équitables pour les soins oculaires.
Titre: BRSET: A Brazilian Multilabel Ophthalmological Dataset of Retina Fundus Photos
Résumé: IntroductionThe Brazilian Multilabel Ophthalmological Dataset (BRSET) addresses the scarcity of publicly available ophthalmological datasets in Latin America. BRSET comprises 16,266 color fundus retinal photos from 8,524 Brazilian patients, aiming to enhance data representativeness, serving as a research and teaching tool. It contains sociodemographic information, enabling investigations into differential model performance across demographic groups. MethodsData from three Sao Paulo outpatient centers yielded demographic and medical information from electronic records, including nationality, age, sex, clinical history, insulin use, and duration of diabetes diagnosis. A retinal specialist labeled images for anatomical features (optic disc, blood vessels, macula), quality control (focus, illumination, image field, artifacts), and pathologies (e.g., diabetic retinopathy). Diabetic retinopathy was graded using International Clinic Diabetic Retinopathy and Scottish Diabetic Retinopathy Grading. Validation used Dino V2 Base for feature extraction, with 70% training and 30% testing subsets. Support Vector Machines (SVM) and Logistic Regression (LR) were employed with weighted training. Performance metrics included area under the receiver operating curve (AUC) and Macro F1-score. ResultsBRSET comprises 65.1% Canon CR2 and 34.9% Nikon NF5050 images. 61.8% of the patients are female, and the average age is 57.6 years. Diabetic retinopathy affected 15.8% of patients, across a spectrum of disease severity. Anatomically, 20.2% showed abnormal optic discs, 4.9% abnormal blood vessels, and 28.8% abnormal macula. Models were trained on BRSET in three prediction tasks: "diabetes diagnosis"; "sex classification"; and "diabetic retinopathy diagnosis". DiscussionBRSET is the first multilabel ophthalmological dataset in Brazil and Latin America. It provides an opportunity for investigating model biases by evaluating performance across demographic groups. The model performance of three prediction tasks demonstrates the value of the dataset for external validation and for teaching medical computer vision to learners in Latin America using locally relevant data sources. Author SummaryIn low-resource settings, access to open medical datasets is crucial for research. Regions such as Latin America often face underrepresentation, resulting in health biases and inequities. To face the scarcity of diverse ophthalmological datasets in these areas, especially in Brazil and Latin America, we introduce the Brazilian Multilabel Ophthalmological Dataset (BRSET) as a means to alleviate biases in medical AI research. Comprising 16,266 color fundus retinal photos from 8,524 Brazilian patients, BRSET integrates sociodemographic information, empowering researchers to investigate biases across demographic groups and diseases. BRSET was extracted from Sao Paulo outpatient centers, and includes demographics, clinical history, and retinal images labeled for anatomical features, quality control, and pathologies like diabetic retinopathy. Validation was performed in a set of selected prediction tasks, such as diabetes diagnosis, sex classification, and diabetic retinopathy diagnosis. BRSETs inclusion of sociodemographic data and experiment metrics underscores its potential efficacy across diverse classification objectives and patient groups, providing crucial insights for medical AI in underrepresented regions.
Auteurs: Luis Filipe Nakayama, D. Restrepo, J. Matos, L. Z. Ribeiro, F. K. Malerbi, L. A. Celi, C. S. Regatieri
Dernière mise à jour: 2024-01-23 00:00:00
Langue: English
Source URL: https://www.medrxiv.org/content/10.1101/2024.01.23.24301660
Source PDF: https://www.medrxiv.org/content/10.1101/2024.01.23.24301660.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.