Simple Science

La science de pointe expliquée simplement

# Informatique# Apprentissage automatique

Une nouvelle méthode améliore les insights des données IRM cérébrales

Une nouvelle approche prédit les mesures manquantes du cerveau en utilisant un apprentissage machine avancé.

― 7 min lire


Prévoir les mesuresPrévoir les mesuresmanquantes du cerveaucérébrales.précision dans l'analyse des donnéesUne nouvelle méthode améliore la
Table des matières

Quand on étudie le cerveau, les chercheurs utilisent souvent des images d'un type de scan appelé imagerie par résonance magnétique (IRM). Ces scans les aident à mesurer différentes parties du cerveau, appelées Régions d'intérêt (ROI). Cependant, parfois, les données de ces scans ne contiennent pas certaines mesures, ce qui complique leur recherche. Par exemple, une grande étude connue sous le nom d'étude ABCD ne publie pas de mesures spécifiques qui pourraient aider à identifier les différences entre les sexes dans la structure cérébrale.

Pour obtenir ces mesures manquantes, une façon est de refaire l'analyse IRM, mais ça peut prendre beaucoup de temps et de ressources. Une meilleure solution est d'utiliser l'apprentissage profond, qui est une forme d'intelligence artificielle, pour prédire les valeurs manquantes en se basant sur les informations déjà disponibles.

Le Problème des Mesures Manquantes

Dans les ensembles de données IRM, il peut y avoir des mesures entières manquantes. Les méthodes traditionnelles peuvent estimer des valeurs à partir de données incomplètes, mais elles supposent que les données manquantes sont aléatoires. Ce n'est pas le cas quand des mesures entières manquent d'un ensemble de données, ce qui crée un problème plus complexe.

Pour y remédier, les chercheurs recommandent de traiter l'Imputation des valeurs manquantes comme un problème de prédiction. Ils identifient un autre ensemble de données qui contient les mesures manquantes et certaines mesures partagées. Puis, ils entraînent un modèle pour faire des prédictions sur les valeurs manquantes en utilisant les données disponibles.

La Solution Proposée

La nouvelle méthode proposée combine un type spécifique de modèle d'apprentissage machine connu sous le nom de réseau de neurones graphiques (GNN) et un classificateur démographique. Un réseau de neurones graphiques aide à représenter les relations entre différentes ROI dans le cerveau sous forme de graphique, où chaque ROI est un nœud et les connexions entre eux sont des arêtes. Cette structure permet au modèle de comprendre comment différentes parties du cerveau peuvent s'influencer mutuellement.

En tenant compte des différences démographiques, comme le sexe, ces modèles peuvent fournir des prédictions plus précises. Par exemple, on sait que les hommes et les femmes peuvent avoir des structures cérébrales différentes, et cela doit être pris en compte lors de l'évaluation des mesures.

Mise en Œuvre

La solution fonctionne d'abord en rassemblant deux ensembles de données : un avec les mesures manquantes et un autre qui a certaines des mêmes mesures. L'entraînement se fait avec un modèle qui apprend à partir des données existantes pour déduire ce que devraient être les mesures manquantes. Les connexions entre les régions du cerveau guident le modèle pour faire de meilleures prédictions. À mesure que le modèle apprend, il peut prédire les valeurs manquantes et aussi classer des informations démographiques sur les sujets individuels.

Le processus d'apprentissage implique de prendre des mesures et de comprendre lesquelles sont liées. En analysant ces relations, le modèle fait des prédictions qui peuvent être comparées aux mesures réelles de l'autre ensemble de données.

Tester l'Approche

Pour valider cette méthode, elle a été testée sur deux ensembles de données principaux, NCANDA et ABCD. L'ensemble de données NCANDA dispose d'informations complètes sur les ROI, tandis que l'ensemble de données ABCD a certaines des mesures nécessaires mais manque d'informations clés. L'objectif était de voir si les prédictions faites par le modèle pouvaient améliorer la compréhension des mesures cérébrales.

En utilisant une méthode appelée validation croisée, l'exactitude des mesures prédites a été évaluée. Dans ce processus, plusieurs tests ont été effectués pour s'assurer que les prédictions étaient fiables. Au lieu de se fier uniquement aux méthodes traditionnelles, le nouveau modèle a montré des performances nettement meilleures, surtout en comparant les scores prédites avec de vraies mesures.

Résultats

Les résultats ont montré que le modèle proposé non seulement prédit les scores de courbure manquants, mais le faisait avec plus de précision que les méthodes existantes. Il a également été observé que des facteurs démographiques, comme le sexe, influençaient significativement le processus d'imputation. Les modèles qui ignoraient ces facteurs produisaient des résultats moins précis, confirmant l'importance de cette nouvelle méthode.

Le modèle innovant était particulièrement efficace car il utilisait les relations inhérentes entre diverses mesures et prenait en compte comment différents démographies pouvaient affecter la structure cérébrale. Cela a conduit à une prédiction plus adaptée pour chaque sujet, améliorant la précision des résultats.

Comprendre les Améliorations de Précision

En appliquant cette nouvelle approche, les chercheurs ont pu évaluer dans quelle mesure le modèle performait en prédisant des scores liés aux tâches d'identification du sexe basées sur des mesures cérébrales. En ajoutant les scores imputés à un classificateur qui identifie le sexe, la précision des prédictions s'est améliorée. C'était particulièrement vrai par rapport à l'utilisation uniquement des données originales disponibles dans l'ensemble de données ABCD.

Pas étonnant que, lorsque des méthodes traditionnelles comme l'imputation avec des valeurs manquantes aléatoires étaient utilisées, les résultats n'étaient pas aussi concluants. Cela suggère que l'utilisation de ces méthodes dans des cas où des mesures entières manquent peut mener à des conclusions inexactes et trompeuses.

Visualiser les Résultats

Pour mieux comprendre l'importance des différentes ROI et comment elles contribuent à la compréhension globale de la structure du cerveau, les chercheurs ont visualisé les connexions au sein du graphique. En examinant quelles ROI avaient le plus d'influence dans le processus de prédiction, ils pouvaient tirer des enseignements sur la façon d'améliorer les futurs modèles.

Les visualisations ont révélé que certaines ROI contribuaient davantage à la tâche d'identification du sexe que d'autres. Les relations entre différentes ROI étaient également cruciales pour réussir à imputer les mesures manquantes. Cette couche supplémentaire de compréhension pourrait grandement aider la recherche future sur la fonctionnalité et la structure du cerveau.

Implications pour la Recherche Future

L'application réussie de cette méthode indique de nouvelles voies pour la recherche en neurosciences. Cela signifie que les scientifiques peuvent désormais combler les lacunes dans les ensembles de données sans avoir besoin de réanalyser les données IRM originales, économisant ainsi du temps et des ressources.

De plus, cela a des implications plus larges pour la généralisation des résultats à travers les ensembles de données. Les chercheurs peuvent désormais travailler avec des ensembles de mesures cohérents, leur permettant de comparer les résultats plus efficacement et de réaliser des études plus complètes.

Conclusion

La méthode d'imputation basée sur les graphiques et consciente des démographies proposée représente une avancée significative dans le comblement des lacunes des mesures cérébrales manquantes. En utilisant l'apprentissage profond et en tenant compte des différences individuelles, cette approche améliore non seulement la précision des données mais aussi la fiabilité des analyses ultérieures.

Les études futures peuvent tirer profit de l'application de cette technique innovante à d'autres ensembles de données, découvrant potentiellement des informations précieuses sur comment différents facteurs affectent la structure et la fonction du cerveau. Dans l'ensemble, ce modèle ouvre la voie à une meilleure précision dans la recherche sur le cerveau et contribue au champ en plein essor des neurosciences.

Source originale

Titre: Imputing Brain Measurements Across Data Sets via Graph Neural Networks

Résumé: Publicly available data sets of structural MRIs might not contain specific measurements of brain Regions of Interests (ROIs) that are important for training machine learning models. For example, the curvature scores computed by Freesurfer are not released by the Adolescent Brain Cognitive Development (ABCD) Study. One can address this issue by simply reapplying Freesurfer to the data set. However, this approach is generally computationally and labor intensive (e.g., requiring quality control). An alternative is to impute the missing measurements via a deep learning approach. However, the state-of-the-art is designed to estimate randomly missing values rather than entire measurements. We therefore propose to re-frame the imputation problem as a prediction task on another (public) data set that contains the missing measurements and shares some ROI measurements with the data sets of interest. A deep learning model is then trained to predict the missing measurements from the shared ones and afterwards is applied to the other data sets. Our proposed algorithm models the dependencies between ROI measurements via a graph neural network (GNN) and accounts for demographic differences in brain measurements (e.g. sex) by feeding the graph encoding into a parallel architecture. The architecture simultaneously optimizes a graph decoder to impute values and a classifier in predicting demographic factors. We test the approach, called Demographic Aware Graph-based Imputation (DAGI), on imputing those missing Freesurfer measurements of ABCD (N=3760) by training the predictor on those publicly released by the National Consortium on Alcohol and Neurodevelopment in Adolescence (NCANDA, N=540)...

Auteurs: Yixin Wang, Wei Peng, Susan F. Tapert, Qingyu Zhao, Kilian M. Pohl

Dernière mise à jour: 2023-08-19 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2308.09907

Source PDF: https://arxiv.org/pdf/2308.09907

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires