Améliorer l'apprentissage inter-sujets avec des machines de Boltzmann restreintes
Un nouvel algorithme améliore la cartographie de l'activité cérébrale entre les individus.
Suya Wu, H. Yang, M. Angjelichinoski, J. Putney, S. Sponberg, V. Tarokh
― 9 min lire
Table des matières
- Objectif de l'apprentissage inter-sujets
- Algorithmes d'apprentissage et leurs défis
- RBMs et leur rôle
- Entraînement du RBM
- Configuration expérimentale
- Extraction de caractéristiques
- Méthodologie pour la cartographie inter-sujets
- Scénarios d'évaluation
- Résultats
- Conclusion
- Travaux futurs
- Source originale
Les algorithmes d'apprentissage en neurosciences doivent bien fonctionner pour différents sujets. Mais créer des algorithmes fiables qui fonctionnent chez différentes personnes, c'est vraiment pas évident. Un des gros défis, c'est que les signaux du cerveau peuvent changer pas mal, même avec des petites variations dans la façon dont ils sont enregistrés. À cause de cette sensibilité, les algorithmes qui marchent pour une personne ne performent souvent pas bien pour une autre. Par exemple, si un algorithme est entraîné avec des données d'une personne, il peut complètement échouer quand on le teste sur une autre, même si les deux sujets réalisent les mêmes tâches.
Ce genre de problème, où les données d'entraînement et de test viennent de groupes différents, est courant en apprentissage automatique. Il existe des méthodes appelées apprentissage par transfert qui traitent spécifiquement de ces soucis. Ces méthodes pourraient être super utiles en neurosciences, surtout pour des applications comme les interfaces cerveau-machine, qui aident à contrôler des appareils avec des signaux cérébraux.
Dans le contexte du problème présenté ici, certaines stratégies ont été développées. Dans des travaux antérieurs, l'accent était mis sur la cartographie des données d'une personne à une autre. Une autre méthode appelée modélisation générative peut aussi aider en créant de nouvelles données basées sur des patterns existants. Cependant, cela nécessite souvent un modèle séparé pour chaque nouvelle tâche ou individu.
Une méthode plus adaptable pour aborder ces problèmes ne dépendrait pas de tâches spécifiques. Certaines approches existantes cherchent à aligner les distributions de données entre les groupes d'entraînement et de test. Ces méthodes ont certaines exigences strictes, garantissant des résultats fiables. Par exemple, une méthode suppose que les données peuvent être alignées par des transformations spécifiques et nécessite que le dataset ait des clusters clairs.
Ces méthodes d'alignement ont été bénéfiques dans diverses situations, mais elles peuvent galérer dans des scénarios plus complexes impliquant plusieurs sujets, où les connexions entre les individus peuvent ne pas être simples. Elles peuvent aussi devenir lourdes en calcul quand on traite des données de haute dimension.
Bien que ces méthodes soient couramment utilisées, leurs limites soulignent le besoin de nouvelles stratégies. Une approche prometteuse implique des techniques d'apprentissage profond, qui peuvent appliquer des modèles non linéaires pour traiter ces problèmes. Cependant, beaucoup de techniques existantes nécessitent des modèles séparés pour chaque individu, ce qui peut devenir impraticable à mesure que le nombre de sujets augmente.
Dans cet article, on présente un nouvel algorithme qui utilise un modèle spécifique appelé Machine de Boltzmann restreinte (RBM) pour gérer efficacement la cartographie entre sujets en neurosciences. Ce modèle a montré de bons résultats dans diverses tâches, y compris des applications en neuroimagerie et analyse de l'activité cérébrale.
Objectif de l'apprentissage inter-sujets
Le but de l'apprentissage inter-sujets est de traduire avec précision les patterns d'activité cérébrale d'un individu dans l'espace de caractéristiques des autres. Après avoir entraîné un RBM avec certains individus, cela devrait permettre de cartographier les données de n'importe quel sujet cible dans l'espace de caractéristiques de n'importe quel sujet source, indépendamment des tâches spécifiques. Cette capacité contraste avec les méthodes plus traditionnelles qui nécessitent un entraînement séparé pour chaque sujet.
Algorithmes d'apprentissage et leurs défis
Pour comprendre la cartographie entre les sujets, on considère la relation entre les vecteurs de caractéristiques. L'activité neuronale de chaque sujet peut être représentée par un vecteur, et il faut les mapper correctement pour assurer une décodage précis des intentions motrices. Cette tâche devient une question de formation des bonnes fonctions pour traduire les signaux du cerveau d'un individu à un autre.
Pour ce faire, on peut examiner les Distributions de probabilité conditionnelle qui relient ces vecteurs de caractéristiques. Il y a des moyens de créer et d'échantillonner ces distributions, ce qui nous permet d'explorer les relations entre les sources et les cibles. Traditionnellement, des méthodes comme la modélisation générative ont été appliquées, mais elles ont souvent des défis, surtout en ce qui concerne le traitement du bruit et de la complexité entre différents sujets.
RBMs et leur rôle
Un RBM est un type de modèle d'apprentissage automatique qui se compose de deux couches d'unités : des unités visibles représentant les données observées (comme les signaux neuronaux) et des unités cachées qui capturent des caractéristiques communes aux données. La connexion entre ces couches permet au modèle d'apprendre des patterns complexes dans les données sans faire d'hypothèses trop fortes.
En appliquant des RBMs dans notre contexte, on peut établir un cadre où les caractéristiques des données neuronales d'un sujet peuvent être transformées dans l'espace de caractéristiques d'un autre sans nécessiter de modèles séparés pour chaque individu.
Entraînement du RBM
Entraîner un RBM implique d'ajuster les paramètres du modèle afin qu'il puisse représenter avec précision la distribution sous-jacente des données. Les méthodes traditionnelles s'appuient souvent sur la divergence contrastive pour cela, mais cette approche peut être inefficace et ne pas fournir des résultats constants.
À la place, on propose une nouvelle méthode basée sur la minimisation de la Divergence de Fisher, ce qui permet des calculs plus faciles et plus efficaces. Cette méthode améliore les processus d'entraînement typiques en simplifiant la façon dont on calcule les gradients et met à jour les paramètres.
Configuration expérimentale
Pour évaluer l'efficacité de nos méthodes proposées, on se concentre sur un dataset collecté auprès de neuf papillons de nuit. Ces sujets ont été exposés à divers stimuli visuels tout en enregistrant leurs fonctions motrices. Chaque papillon effectue des mouvements spécifiques en réponse aux signaux visuels, et notre objectif est de décoder ces réponses motrices basées sur leurs données neuronales.
Les données collectées comprennent l'activité de spikes des muscles contrôlant le vol du papillon. Chaque papillon a été testé avec six stimuli visuels différents, et les trains de spikes résultants fournissent des informations détaillées sur l'activité neuronale pendant le vol.
Extraction de caractéristiques
Avant de mapper les données, il faut convertir les spikes bruts en représentations de caractéristiques utilisables. Cela implique d'utiliser des noyaux gaussiens pour lisser les données de spikes et créer une représentation uniforme. Les vecteurs de caractéristiques résultants sont ensuite soumis à des techniques de réduction de dimension comme l'ACP pour améliorer l'interprétation et l'analyse.
Une fois qu'on a ces représentations, on peut poursuivre nos tâches d'apprentissage inter-sujets.
Méthodologie pour la cartographie inter-sujets
Pour mapper efficacement les caractéristiques cibles aux caractéristiques sources, on utilise le RBM entraîné pour inférer des représentations. Le processus implique d'initialiser le modèle basé sur les caractéristiques cibles, puis d'utiliser le RBM pour générer des représentations sources à travers un processus d'échantillonnage.
La phase d'échantillonnage nécessite de faire passer le modèle par plusieurs itérations pour affiner les sorties, produisant finalement la représentation finale qui aligne les données cibles avec l'espace de caractéristiques source.
Scénarios d'évaluation
On évalue la performance de notre méthode sous deux scénarios principaux : un où on introduit les données d'un seul sujet comme source et on tente de mapper tous les autres dessus, et un autre où un sujet est traité comme cible tandis que tous les autres servent de sources.
Pour les deux scénarios, on compare la performance de notre modèle avec celle de méthodes existantes, comme le décodage neuronal spécifique à un sujet, qui entraîne un modèle exclusivement sur les données d'un seul sujet mais qui performe mal chez différents individus et dans différentes conditions.
Résultats
Les résultats montrent que notre méthode surpasse significativement les stratégies existantes, y compris les techniques d'alignement traditionnelles. En mappant les caractéristiques cibles dans l'espace de caractéristiques approprié, on atteint une grande précision dans le décodage des états comportementaux associés aux stimuli visuels.
Les résultats démontrent aussi que l'approche d'entraînement par divergence de Fisher fournit de meilleurs résultats comparés aux méthodes classiques, mettant en lumière les avantages de notre cadre proposé.
Conclusion
Ce nouveau cadre pour la cartographie inter-sujets utilisant des RBMs montre des résultats prometteurs en neurosciences. La capacité d'adapter efficacement les données neuronales de divers sujets en représentations cohésives pourrait ouvrir la voie à de meilleures interventions et outils dans les interfaces cerveau-machine et d'autres applications.
Travaux futurs
Plusieurs pistes pour la recherche future incluent l'exploration d'améliorations dans l'entraînement des modèles, le développement de modèles RBM invariants aux sujets, et le test d'applications sur différents types de signaux neuronaux. En élargissant ce travail, on vise à améliorer notre compréhension de la fonction cérébrale à travers diverses populations et conditions.
Titre: Cross-subject Mapping of Neural Activity with Restricted Boltzmann Machines
Résumé: Subject-to-subject variability is a common challenge in generalizing neural data models across subjects. While many methods exist that map one subject to another, it remains challenging to combine many subjects in a computationally efficient manner, especially with features that are highly non-linear such as when considering populations of spiking neurons or motor units. Our objective is to transfer data from one or more target subjects to the data space of one or more source subject(s) such that the neural decoder of the source subject can directly decode the target data when the source(s) is not available during test time. We propose to use the Gaussian-Bernoulli Restricted Boltzmann Machine (RBM); once trained over the entire set of subjects, the RBM allows the mapping of target features on source feature spaces using Gibbs sampling. We also consider a novel computationally efficient training technique for RBMs based on the minimization of the Fisher divergence, which allows the gradients of the RBM to be computed in closed form, in contrast to the more traditional contrastive divergence. We apply our methods to decode turning behaviors from a comprehensive spike-resolved motor program - neuromuscular recordings of spike trains from the ten muscles that control wing motion in an agile flying Manduca sexta. The dataset consists of the comprehensive motor program recorded from nine subjects driven by six discrete visual stimuli. The evaluations show that the target features can be decoded using the source classifier with an accuracy of up to 95% when mapped using an RBM trained by Fisher divergence. Significant StatementIn this study, we address the variability of neural data across subjects, which is a significant obstacle in developing models that can generalize across subjects. Our objective is to create a task-specific representation of the target subject signal in the feature space of the source subject. Our proposed RBM architectures achieve highly flexible and accurate cross-subject mapping with few assumptions. Our Fisher RBM improved the previous state of the art method by 300%. Our methods show promise in generalizing features of complex neural datasets across individuals, tuning neural interfaces to subject-specific features, and leveraging data across multiple subjects when experiments are limited in time or completeness.
Auteurs: Suya Wu, H. Yang, M. Angjelichinoski, J. Putney, S. Sponberg, V. Tarokh
Dernière mise à jour: 2024-12-06 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2023.04.14.536854
Source PDF: https://www.biorxiv.org/content/10.1101/2023.04.14.536854.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.