Segmentation Cellulaire Unifiée : Faire Avancer la Transcriptomique Spatiale
Une nouvelle méthode améliore la segmentation des cellules pour de meilleures études de tissus.
― 9 min lire
Table des matières
- Qu'est-ce que la Transcriptomique spatiale ?
- L'importance d'une segmentation cellulaire précise
- Technologies actuelles et leurs différences
- Méthodes de segmentation cellulaire
- Méthodes basées sur les transcrits
- Méthodes basées sur les images
- L'approche unifiée de la segmentation cellulaire (UCS)
- Comment fonctionne UCS
- Avantages de l'UCS
- Comparaison des performances
- Applications diverses de l'UCS
- Amélioration de l'annotation des types cellulaires
- Amélioration des profils d'expression génique
- Découverte des interactions cellulaires
- Analyse morphologique
- Détection des cellules manquantes
- Efficacité computationnelle
- Le processus de prétraitement des données SST
- La structure du modèle UCS
- Entraînement du modèle UCS
- Fonctions avancées : softmask évolutif et gènes marqueurs
- Prise en compte de la variabilité de l'expression génique
- Analyse en aval
- Conclusion
- Source originale
- Liens de référence
Les cellules sont les éléments de base de tous les êtres vivants. Elles viennent sous différentes formes et tailles et remplissent diverses fonctions. Dans nos corps, ces cellules s'assemblent pour former des tissus et des organes. Comprendre comment ces cellules fonctionnent ensemble, partagent des signaux et prennent des décisions sur leur environnement est crucial pour faire avancer la recherche médicale et biologique.
Transcriptomique spatiale ?
Qu'est-ce que laLa transcriptomique spatiale est une technique qui permet aux scientifiques de mesurer l'activité des gènes dans les cellules tout en gardant des infos sur où ces cellules se trouvent dans un tissu. Une méthode plus récente appelée transcriptomique spatiale subcellulaire (SST) permet aux chercheurs de voir comment les gènes s’expriment au sein de zones encore plus petites des cellules. Cette approche offre un aperçu précieux sur comment différentes cellules interagissent et fonctionnent dans le contexte de leur environnement.
L'importance d'une segmentation cellulaire précise
Un des principaux défis en utilisant la SST est d'identifier avec précision les cellules individuelles dans les échantillons de tissus. Cette étape est importante parce que si on ne distingue pas correctement où se termine une cellule et où commence une autre, ça peut mener à des erreurs dans l'analyse des données. Par exemple, si la zone d'une cellule est trop grande, elle pourrait inclure des infos provenant des cellules voisines, ce qui fausserait les résultats. À l'inverse, si la zone d'une cellule est trop petite, des données importantes pourraient être manquées, ce qui donnerait des infos incomplètes sur le comportement des cellules.
Technologies actuelles et leurs différences
Les différentes technologies pour la SST ont des forces et des faiblesses différentes. Certaines méthodes, comme MERSCOPE de Vizgen et Xenium de 10X Genomics, offrent une très haute résolution, ce qui est essentiel pour une analyse précise de l'organisation des cellules. D'autres méthodes, comme Stereo-seq, peuvent capturer beaucoup de gènes en même temps mais peuvent ne pas être aussi détaillées.
Par exemple, certaines plateformes se concentrent sur le profilage de quelques centaines de gènes pour des études spécifiques, tandis que d'autres peuvent analyser des milliers de gènes. Cette variété permet aux chercheurs de choisir le meilleur outil pour leurs besoins spécifiques.
Méthodes de segmentation cellulaire
Il existe deux sortes de méthodes pour la segmentation cellulaire : basées sur les transcrits et basées sur les images.
Méthodes basées sur les transcrits
Ces méthodes s'appuient sur des informations sur l'activité des gènes. Un exemple notable est BIDCell, qui utilise beaucoup de données pour définir avec précision la forme des cellules allongées mais qui n'est pas toujours pratique pour un usage quotidien. Un autre exemple, JSTA, utilise l'apprentissage automatique pour assigner des types de cellules mais peut être limité en portée. D'autres méthodes, comme SCS, tirent parti des réseaux neuronaux modernes pour apprendre les positions des cellules, mais cela peut parfois conduire à des résultats instables.
Méthodes basées sur les images
Celles-ci reposent principalement sur des images prises à partir d'échantillons teintés, se concentrant souvent sur les Noyaux cellulaires teintés. Des méthodes comme Cellpose peuvent traiter ces images pour définir les frontières des cellules. Cependant, elles peuvent avoir du mal avec la précision car elles s'appuient souvent uniquement sur les images des noyaux.
L'approche unifiée de la segmentation cellulaire (UCS)
En réponse aux défis rencontrés par les méthodes existantes, une nouvelle méthode appelée la segmentation cellulaire unifiée (UCS) a été développée. UCS combine une segmentation précise des noyaux à partir de teintures avec des données d'expression des gènes pour mieux définir où se trouvent les cellules.
Comment fonctionne UCS
Le modèle UCS utilise deux étapes principales. D'abord, il examine les zones dans le tissu pour trouver des régions cellulaires potentielles en analysant l'expression des gènes. Ensuite, il affine ces hypothèses en utilisant la position des noyaux pour créer une frontière détaillée pour chaque cellule. Cette double approche aide à obtenir une segmentation cellulaire plus précise et améliore la qualité des données pour des analyses ultérieures.
Avantages de l'UCS
L'UCS est conçu pour être applicable sur différentes plateformes de SST, permettant d'obtenir des résultats constants peu importe la technologie utilisée. En plus, UCS est efficace en termes de calcul, ce qui veut dire qu'il traite les données rapidement, faisant gagner du temps aux chercheurs.
Comparaison des performances
L'UCS a été testé par rapport à d'autres méthodes et montre des résultats prometteurs. Comparé aux méthodes traditionnelles, UCS identifie non seulement plus de cellules, mais le fait aussi avec une meilleure précision et des détails. Cette segmentation améliorée aide les chercheurs à analyser le comportement cellulaire, à étudier comment différentes cellules dans les tissus interagissent et à comprendre les processus au sein de ces tissus.
Applications diverses de l'UCS
Amélioration de l'annotation des types cellulaires
Une segmentation précise permet aux chercheurs de mieux identifier et classifier différents types de cellules. Par exemple, dans un échantillon de cancer du sein, UCS peut aider à distinguer plus efficacement entre différents sous-types de cancer que les méthodes précédentes.
Amélioration des profils d'expression génique
Les résultats de segmentation d'UCS génèrent des profils d'expression génique plus fiables en s'assurant que les tailles et les frontières des cellules sont correctes. Cette précision conduit à des données d'expression génique qui s'alignent étroitement avec d'autres ensembles de données établis, rendant les analyses plus fiables.
Découverte des interactions cellulaires
Avec une meilleure segmentation, UCS peut aussi aider à étudier comment les cellules interagissent entre elles. Comprendre ces relations est essentiel pour avoir des aperçus sur les mécanismes de la maladie et le fonctionnement des tissus.
Analyse morphologique
UCS est particulièrement bon pour maintenir la forme des cellules allongées, comme les fibroblastes. Ce détail est souvent perdu dans d'autres méthodes, mais l'attention d'UCS à la forme garantit que les données résultantes sont pertinentes et biologiquement significatives.
Détection des cellules manquantes
Un avantage significatif de l'UCS est sa capacité à identifier des cellules que les méthodes d'images traditionnelles négligent souvent. En analysant les données d'expression génique et les informations d'imagerie, UCS peut détecter des régions susceptibles de contenir des cellules qui ne sont peut-être pas évidentes visuellement.
Efficacité computationnelle
L'UCS est efficace en termes de ressources computationnelles, ce qui le rend adapté aux grands ensembles de données. Alors que d'autres méthodes peuvent prendre des heures, voire des jours à traiter, UCS peut gérer de grands volumes de données en une fraction du temps, permettant aux chercheurs de travailler plus efficacement.
Le processus de prétraitement des données SST
Pour préparer les données SST à l'analyse avec UCS, les chercheurs convertissent les informations sur les transcrits en un format structuré qui inclut à la fois le compte de gènes et la localisation spatiale. Ils segmentent aussi les cellules en fonction des ressources fournies par la plateforme technologique spécifique.
La structure du modèle UCS
Le modèle UCS utilise deux principaux réseaux neuronaux conçus spécifiquement pour la tâche. Le premier réseau prédit les zones cellulaires potentielles en se basant sur les données d'expression génique, tandis que le second réseau affine ces prévisions pour déterminer les frontières exactes des cellules.
Entraînement du modèle UCS
L'entraînement implique de définir soigneusement les échantillons de premier plan (zones cellulaires potentielles) et de fond (zones non cellulaires) pour assurer un apprentissage précis. Les réseaux sont optimisés pour distinguer entre ces zones, facilitant de meilleurs résultats en matière de segmentation.
Fonctions avancées : softmask évolutif et gènes marqueurs
Pour relever le défi des cellules allongées, UCS utilise une stratégie qui ajuste le softmask en fonction des formes des cellules. De plus, en intégrant des informations sur des marqueurs spécifiques, UCS peut mieux associer les cellules à leurs identités fonctionnelles.
Prise en compte de la variabilité de l'expression génique
Lors de l'analyse d'ensembles de données avec de nombreux gènes, UCS se concentre sur les gènes les plus variables pour simplifier le processus. En segmentant les données en portions plus petites, le modèle peut s'adapter et apprendre des caractéristiques uniques de différentes zones de tissu.
Analyse en aval
Une fois la segmentation cellulaire terminée, les chercheurs peuvent effectuer diverses analyses en utilisant des logiciels spécialisés pour comprendre les tendances d'expression génique, les interactions cellulaires et les motifs spatiaux au sein des tissus.
Conclusion
La méthode de Segmentation Cellulaire Unifiée (UCS) représente une avancée significative dans le domaine de la transcriptomique spatiale. En combinant efficacement des données transcriptomiques avec des infos précises sur les noyaux, UCS fournit aux chercheurs un outil puissant pour étudier des tissus complexes. L'amélioration de la précision de la segmentation non seulement enrichit la compréhension du comportement cellulaire mais contribue aussi à de meilleures informations sur les mécanismes des maladies.
UCS se distingue par son efficacité et sa polyvalence, le rendant adapté à un large éventail de technologies SST. Alors que les chercheurs continuent d'explorer les relations complexes au sein des tissus, UCS promet de révéler des aperçus biologiques importants, faisant progresser le domaine de la recherche biomédicale et améliorant notre compréhension de la santé et de la maladie.
Titre: UCS: a unified approach to cell segmentation for subcellular spatial transcriptomics
Résumé: Subcellular Spatial Transcriptomics (SST) represents an innovative technology enabling researchers to investigate gene expression at the subcellular level within tissues. To comprehend the spatial architecture of a given tissue, cell segmentation plays a crucial role in attributing the measured transcripts to individual cells. However, existing cell segmentation methods for SST datasets still face challenges in accurately distinguishing cell boundaries due to the varying characteristics of SST technologies. In this study, we propose a unified approach to cell segmentation (UCS) specifically designed for SST data obtained from diverse platforms, including 10X Xenium, NanoString CosMx, MERSCOPE, and Stereo-seq. UCS leverages deep learning techniques to achieve high accuracy in cell segmentation by integrating nuclei segmentation from nuclei staining and transcript data. Compared to current methods, UCS not only provides more precise transcript assignment to individual cells but also offers computational advantages for large-scale SST data analysis. The analysis output of UCS further supports versatile downstream analyses, such as subcellular gene classification and missing cell detection. By employing UCS, researchers gain the ability to characterize gene expression patterns at both the cellular and subcellular levels, leading to a deeper understanding of tissue architecture and function.
Auteurs: Can Yang, Y. Chen, X. Xu, X. Wan, J. Xiao
Dernière mise à jour: 2024-07-08 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.07.08.601384
Source PDF: https://www.biorxiv.org/content/10.1101/2024.07.08.601384.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://github.com/YangLabHKUST/UCS
- https://scvi-tools.org/
- https://scanpy.readthedocs.io/en/stable/
- https://squidpy.readthedocs.io/en/stable/
- https://github.com/ckmah/bento-tools
- https://www.10xgenomics.com/jp/analysis-guides/using-baysor-to-perform-xenium-cell-segmentation
- https://github.com/clEsperanto/pyclesperanto_prototype