Déchiffrer les liens entre le cerveau et le comportement avec la corrélation PLS
Une nouvelle approche pour trouver des liens entre l'activité cérébrale et les comportements.
Matthew Danyluik, Y. Zeighami, A. Mukora, M. Lepage, J. Shah, R. Joober, B. Misic, Y. Iturria-Medina, M. Chakravarty
― 9 min lire
Table des matières
- Comment fonctionne le PLS
- L'importance du Test de permutation
- Le rôle de la rotation de Procruste
- Comprendre les variables latentes
- Analyse des données simulées
- Résultats clés des données simulées
- Application dans le monde réel : l'étude UK Biobank
- Observations à partir des données de la UK Biobank
- Le besoin de métriques supplémentaires
- Conclusion
- Implications pour la recherche future
- Source originale
- Liens de référence
La corrélation par moindres carrés partiels (PLS) est une méthode utilisée dans la recherche sur le cerveau pour trouver des liens entre l'activité cérébrale et les comportements. Cette technique aide les chercheurs à identifier des modèles dans les données cérébrales et à comprendre comment ils se rapportent à divers résultats, comme la performance cognitive ou les comportements. L'objectif de la corrélation PLS est de découvrir des relations cachées au sein de jeux de données complexes qui incluent plusieurs mesures provenant à la fois du cerveau et des comportements.
Comment fonctionne le PLS
Quand on utilise le PLS, les chercheurs commencent par collecter des données sur le cerveau et des mesures comportementales. Par exemple, ils peuvent recueillir des infos sur l'activité cérébrale tout en enregistrant des comportements comme des tâches de mémoire ou des niveaux d'activité physique. Les ensembles de données sont organisés en matrices, ce qui permet aux chercheurs d'analyser comment ils se relient les uns aux autres.
Le PLS commence par examiner la relation entre ces matrices. Il calcule une matrice de corrélation qui montre comment les données cérébrales et comportementales interagissent. Cette étape implique un processus mathématique appelé décomposition en valeurs singulières (SVD), qui aide à identifier des facteurs clés (ou Variables Latentes) qui expliquent le plus de variance dans les données.
Les variables latentes résultantes se composent de combinaisons de mesures cérébrales et comportementales. Les chercheurs peuvent suivre comment ces variables latentes changent entre différents échantillons pour identifier des motifs significatifs.
Test de permutation
L'importance duPour évaluer si les motifs identifiés par le PLS sont significatifs, les chercheurs utilisent une méthode appelée test de permutation. Cette technique consiste à mélanger aléatoirement les données pour créer une distribution "nulle", qui sert de référence pour la comparaison. En comparant les résultats originaux avec cette distribution nulle, les chercheurs peuvent déterminer si les relations observées sont statistiquement significatives.
En termes simples, le test de permutation aide les chercheurs à vérifier si les motifs qu'ils ont trouvés sont réels ou s'ils pourraient être survenus par chance.
Le rôle de la rotation de Procruste
Lors des tests de permutation, une étape appelée rotation de Procruste est souvent appliquée. Cette étape aligne les données permutées avec les données originales, permettant des comparaisons plus précises. En gros, cela ajuste et réorganise les données pour s'assurer que les variables latentes des données permutées correspondent étroitement à celles des données originales.
Cependant, l'impact de cette rotation sur la signification des résultats n'a pas été profondément examiné. On ne sait pas si l'application de la rotation fournit systématiquement une image plus claire sur l'existence réelle des variables latentes dans les données.
Comprendre les variables latentes
Les variables latentes sont les facteurs sous-jacents qui révèlent des relations entre les données cérébrales et comportementales. On peut les considérer comme des variables cachées qui influencent les résultats observables. Quand les chercheurs identifient des variables latentes significatives, ils peuvent faire des inférences sur la manière dont l'activité cérébrale influence le comportement ou vice versa.
Cependant, bien que découvrir des variables latentes significatives soit important, comprendre leur force et leur stabilité est tout aussi crucial. La taille de l'effet, ou la force d'une relation, indique combien de variance dans une variable peut être expliquée par une autre variable. La stabilité se réfère à la manière dont ces résultats sont cohérents à travers différents échantillons.
Analyse des données simulées
Pour mieux comprendre l'impact des différents tests de permutation et de la rotation de Procruste, les chercheurs créent des ensembles de données simulées. Ces ensembles de données impliquent des données aléatoires qui ne contiennent aucune relation réelle. En observant comment le PLS réagit à ces ensembles de données simulées, les chercheurs peuvent examiner comment différentes méthodes de test fonctionnent pour détecter des effets qui ne sont en fait pas présents.
Résultats clés des données simulées
Dans leurs analyses de données simulées, les chercheurs ont constaté que les tests de permutation produisaient souvent des résultats significatifs même quand aucun effet réel n'existait. C'était notamment vrai pour les tests rotatifs, qui avaient tendance à détecter des variables latentes peu importe la taille de l'échantillon ou les niveaux de bruit. En revanche, les tests non rotatifs étaient plus conservateurs, détectant moins d'effets mais fournissant généralement une indication plus fiable de l'absence de variables latentes.
La force et la stabilité des variables latentes variaient aussi selon les caractéristiques des données simulées. Par exemple, quand les tailles d'échantillons augmentaient, la probabilité de détecter des effets vrais augmentait. Cependant, même lorsque des effets étaient codés, la capacité à les identifier de manière cohérente dépendait beaucoup de la nature des ensembles de données.
Application dans le monde réel : l'étude UK Biobank
Pour voir comment ces résultats se traduisent dans des données réelles, les chercheurs ont mené des analyses PLS sur des données de la UK Biobank, qui contient des informations sur la santé et le mode de vie de plus de 28 000 participants. Les chercheurs ont recueilli des données cérébrales et des facteurs de risque comportementaux, comme des habitudes de vie liées au vieillissement.
Tout comme avec les ensembles de données simulées, ils ont effectué des analyses PLS sur divers sous-échantillons tirés des participants de la UK Biobank. Ils ont examiné si la signification, la force et la stabilité changeaient selon les tailles d'échantillons.
Observations à partir des données de la UK Biobank
En analysant les données de la UK Biobank, les chercheurs ont vu que le nombre de variables latentes significatives augmentait avec la taille de l'échantillon. Cependant, les méthodes de test de signification produisaient des résultats différents. Les tests non rotatifs suggéraient que presque toutes les variables latentes étaient significatives dans les plus grands échantillons, tandis que les tests rotatifs étaient plus conservateurs et ne détectaient des variables significatives que lorsqu'elles étaient fortes.
En évaluant la force des variables latentes dans les données réelles, il est devenu clair que bien que beaucoup de variables paraissaient significatives, leur force et stabilité réelles reflétaient des degrés de fiabilité variés. Cela indiquait que les chercheurs ne devraient pas compter uniquement sur la signification statistique pour déterminer la pertinence des variables latentes.
Le besoin de métriques supplémentaires
Étant donné les résultats biaisés des différents tests de permutation, les chercheurs ont souligné l'importance d'incorporer des métriques supplémentaires dans les analyses PLS. Ces mesures supplémentaires pourraient inclure l'évaluation de la force des variables latentes et de leur stabilité à travers différents échantillons.
En utilisant à la fois la signification statistique et les estimations de taille d'effet, les chercheurs peuvent créer une compréhension plus complète des variables latentes dans leurs données. Cette approche équilibrée garantirait que les résultats soient non seulement statistiquement significatifs mais aussi pertinents d'un point de vue neurobiologique.
Conclusion
L'étude de la corrélation par moindres carrés partiels en neuroimagerie souligne la complexité de la compréhension des relations entre le cerveau et le comportement. Bien que des résultats significatifs puissent suggérer des connexions importantes, ils ne capturent pas complètement les vérités sous-jacentes sur ces relations. La combinaison de tests de signification et de mesures de force et de stabilité est essentielle pour fournir une vue nuancée des phénomènes en jeu.
À long terme, les chercheurs sont encouragés à adopter ces stratégies complémentaires pour prendre des décisions éclairées concernant le rapport des variables latentes dans leurs analyses. Ce faisant, ils peuvent améliorer la fiabilité et l'interprétation de leurs résultats de recherche, contribuant ainsi à de meilleures perspectives sur les dynamiques complexes de la fonction cérébrale et du comportement.
Implications pour la recherche future
Alors que la recherche en neuroimagerie continue d'évoluer, il est crucial de perfectionner des méthodes comme la corrélation par moindres carrés partiels. Comprendre comment différentes méthodes de test impactent les résultats aidera à s'assurer que les découvertes reflètent fidèlement les données sous-jacentes. Les études futures devraient tenir compte des implications des tests de permutation et du rôle de la rotation dans l'interprétation des résultats.
De plus, en continuant de souligner l'importance des métriques de force et de stabilité, les chercheurs peuvent renforcer la rigueur et la clarté de leurs analyses. Cet effort continu contribuera à enrichir le corpus de connaissances dans le domaine de la neuroimagerie et ouvrira la voie à des découvertes plus robustes concernant la fonction cérébrale et les résultats comportementaux.
En résumé, l'intégration de diverses approches de test, de métriques supplémentaires et une attention particulière à la méthodologie renforceront finalement le domaine de la recherche en neuroimagerie. En respectant ces principes, les chercheurs continueront à faire progresser notre compréhension du cerveau et de sa relation avec le comportement humain.
Titre: Evaluating permutation-based inference for partial least squares analysis of neuroimaging data
Résumé: Partial least squares (PLS) is actively leveraged in neuroimaging work, typically to map latent variables (LVs) representing brain-behaviour associations. LVs are considered statistically significant if they tend to capture more covariance than LVs derived from permuted data, with a Procrustes rotation applied to map each set of permuted LVs to the space defined by the originals, creating an "apples to apples" comparison. Yet, it has not been established whether applying the rotation makes the permutation test more sensitive to whether true LVs are present in a dataset, and it is unclear if significance alone is sufficient to fully characterize a PLS decomposition, given that complementary metrics like strength and split-half stability may offer non-redundant information about the LVs. Accordingly, we performed PLS analyses across a range of simulated datasets with known latent effects, observing that the Procrustes rotation systematically weakened the null distributions for the first LV. By extension, the first LV was nearly always significant, regardless of whether the effect was weak, undersampled, noisy, or simulated at all. But, if no rotation was applied, all possible LVs tended to be significant as we increased the sample size of UK Biobank datasets. Meanwhile, LV strength and stability metrics accurately tracked our confidence that effects were present in simulated data, and allowed for a more nuanced assessment of which LVs may be relevant in the UK Biobank. We end by presenting a list of considerations for researchers implementing PLS permutation testing, and by discussing promising alternative tests which may alleviate the concerns raised by our findings.
Auteurs: Matthew Danyluik, Y. Zeighami, A. Mukora, M. Lepage, J. Shah, R. Joober, B. Misic, Y. Iturria-Medina, M. Chakravarty
Dernière mise à jour: 2024-10-29 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.08.02.606412
Source PDF: https://www.biorxiv.org/content/10.1101/2024.08.02.606412.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.