MALAT1 nutzen, um die Qualität von scRNA-seq-Daten zu verbessern
MALAT1-Expression hilft dabei, hochwertige Zellen in der Einzelzell-RNA-Sequenzierung zu identifizieren.
― 6 min Lesedauer
Inhaltsverzeichnis
- Herausforderungen bei scRNA-seq
- Kontaminationsquellen
- Identifizierung von Zellen bei scRNA-seq
- Herausfiltern von problematischen Tropfen
- Einführung von DropletQC
- Neue Ansätze zum Filtern von Zellen
- Die Rolle von MALAT1
- MALAT1 als Qualitätsindikator
- Verwendung von MALAT1 zum Filtern von Zellen
- Schätzung des MALAT1-Schwellenwerts
- Analyse verschiedener Datensätze
- Bestimmte Zelltypen und MALAT1-Level
- Bedeutung der Qualitätskontrolle
- Ein Standard fürs Filtern von Zellen
- Schlussfolgerungen
- Originalquelle
- Referenz Links
Einzelzell-RNA-Sequenzierung (ScRNA-seq) ist eine Methode, um die Genexpression in einzelnen Zellen zu untersuchen. Mit dieser Technik können Wissenschaftler verstehen, wie sich verschiedene Zellen in einer Probe verhalten und wie sie sich voneinander unterscheiden. Allerdings können bestimmte Faktoren die Qualität der Daten aus diesen Experimenten beeinflussen.
Herausforderungen bei scRNA-seq
Eine grosse Herausforderung bei scRNA-seq ist sicherzustellen, dass die RNA, die in einer Zelle detektiert wird, tatsächlich von dieser speziellen Zelle stammt. Einige Methoden zur Zelleisolierung können zu Kontamination führen, bei der RNA aus anderen Quellen ausserhalb der Zelle die Ergebnisse stört. Dieses Problem kann während der Zellverarbeitungsphase auftreten.
Kontaminationsquellen
Bei der Verwendung von tropfenbasierten Methoden für scRNA-seq könnten Zellen RNA in die umgebende Lösung abgeben. Diese freigesetzte RNA, auch als Ambient-RNA bezeichnet, kann sich mit der RNA der Zellen vermischen, was es schwierig macht zu bestimmen, welche RNA zu welcher Zelle gehört. Manchmal können Tropfen, die eigentlich Zellen einfangen sollten, stattdessen mit dieser Ambient-RNA gefüllt werden, was zu Fehlidentifikationen führt.
Ausserdem sind bestimmte Zelltypen während der Verarbeitung anfälliger für Zerfall, wodurch sie ihre RNA freisetzen. Das kann Probleme verursachen, da beschädigte oder leere Tropfen, die Zellfragmente enthalten, dennoch die anfänglichen Screeningprozesse durchlaufen und unzuverlässige Ergebnisse liefern können.
Identifizierung von Zellen bei scRNA-seq
In typischen scRNA-seq-Experimenten werden eine grosse Anzahl von Tropfen produziert. Nur einige dieser Tropfen enthalten intakte Zellen. Forscher suchen nach Tropfen mit hohen Werten von einzigartigen molekularen Identifikatoren (UMIs), um die Anwesenheit von Zellen zu identifizieren. Sie können auch statistische Methoden verwenden, um das RNA-Profil der Tropfen mit einem Hintergrundprofil zu vergleichen, um bei der Identifizierung zu helfen.
Herausfiltern von problematischen Tropfen
Um die Datenqualität sicherzustellen, entfernen Forscher oft Tropfen, die mehrere Zellen enthalten, bekannt als Doublets, oder Tropfen, die Anzeichen von Zellschäden zeigen. Allerdings enthalten viele Datensätze auch nach diesen Filtern immer noch Zellen, die nicht intakt sind oder mit Ambient-RNA vermischt sind, was zu schlechten Ergebnissen führt.
Einführung von DropletQC
Um das Problem beschädigter Zellen zu lösen, wurde ein Tool namens DropletQC entwickelt. Es bewertet die Qualität von Zellen basierend auf ihrem nukleären Anteil, einem Mass für das Verhältnis zwischen ihrer zytoplasmatischen RNA und ihrer nuklearen RNA. Wenn Tropfen niedrige Werte an nuklearer RNA zeigen, könnten sie als leer oder mit beschädigten Zellen identifiziert werden.
Obwohl DropletQC nützlich ist, benötigt es viel Rechenleistung, um grosse Datenmengen zu verarbeiten. Zudem kann der Zugang zu den Rohsequenzierungsdaten manchmal eingeschränkt sein, was die Neubewertung bestehender Datensätze erschwert.
Neue Ansätze zum Filtern von Zellen
Seit der Einführung von DropletQC sind andere Methoden aufgetaucht, die das Filtern von Zellen verbessern. Zum Beispiel analysiert SampleQC die Verteilung von RNA-Merkmalen innerhalb von Zelltypen und identifiziert Ausreisser, die nicht den erwarteten Mustern entsprechen. Eine weitere Methode, QClus, untersucht mehrere Qualitätsmetriken in den Daten, um Zellen mit niedrigen Werten ungespleisster RNA zu kennzeichnen.
MALAT1
Die Rolle vonMALAT1 ist eine spezifische Art von RNA, bekannt als lange nicht-kodierende RNA (lncRNA), die hauptsächlich im Zellkern vorkommt. Sie wird in vielen Zelltypen konstant exprimiert und ist an wichtigen zellulären Prozessen beteiligt.
Forschende fanden heraus, dass das Ausdrucksniveau von MALAT1 gut mit dem nukleären Anteil von Zellen korreliert. Das bedeutet, dass die Wissenschaftler durch die Messung von MALAT1-Spiegeln schnell beurteilen können, ob ein Tropfen wahrscheinlich einen intakten Zellkern enthält.
MALAT1 als Qualitätsindikator
Datenanalysen zeigten, dass die MALAT1-Expression einer der zuverlässigsten Indikatoren für die Zellqualität in scRNA-seq-Experimenten ist. Zellen mit niedrigen MALAT1-Expressionen werden oft zur weiteren Überprüfung markiert, da sie möglicherweise beschädigte oder leere Tropfen sind. In vielen Datensätzen ist die Korrelation zwischen MALAT1-Expression und dem nuklearen Anteil stark, was darauf hindeutet, dass es ein effektives Mass zur Identifizierung intakter Zellen ist.
Verwendung von MALAT1 zum Filtern von Zellen
Forscher untersuchten, ob sie den Prozess zur Identifizierung von Zellen mit niedriger Qualität basierend auf MALAT1-Expressionsniveaus automatisieren könnten. Sie fanden heraus, dass MALAT1 nach der Normalisierung der RNA-Reads ein spezifisches Ausdrucksmuster zeigt. Datensätze mit MALAT1-Werten unter einem bestimmten Schwellenwert können zur Überprüfung oder Entfernung markiert werden, da diese niedrigen Werte typischerweise leere Tropfen oder Zellen ohne Kerne anzeigen.
Schätzung des MALAT1-Schwellenwerts
Eine grafische Methode wurde entwickelt, um den Schwellenwert zu schätzen, unter dem Zellen markiert werden sollten. Durch die Analyse der Verteilung der MALAT1-Expression im Datensatz können Forscher eine untere Grenze erkennen. Zellen, die unterhalb dieses Limits liegen, sind wahrscheinlich nicht intakt.
Analyse verschiedener Datensätze
Durch das Anwenden dieses MALAT1-Filtrierungsprozesses auf verschiedene Datensätze beobachteten die Forscher konsistente Ergebnisse sowohl bei gesunden als auch bei erkrankten Proben. Insbesondere zeigten bestimmte Zelltypen, wie Leberzellen und Erythrozyten, tendenziell niedrige MALAT1-Expressionsniveaus und dienten als Kontrolle für das Filtrierungsmodell.
Bestimmte Zelltypen und MALAT1-Level
Einige Gewebe können bei der Analyse der Zellqualität Herausforderungen darstellen. Zum Beispiel zeigen Leberzellen oft niedrige MALAT1-Level aufgrund ihrer Fragilität während der Verarbeitung. Das kann zu Fehlidentifikationen von Zellen führen, da Ambient-RNA die Ergebnisse kontaminieren kann.
In vielen Datensätzen wurden Cluster von Zellen identifiziert, die hohe MALAT1-Spiegel aufweisen, was auf intakte Kerne hindeutet. Im Gegensatz dazu wurden Cluster mit niedrigen MALAT1-Werten häufig für potenzielle Schäden markiert, was darauf hindeutet, dass sie Fragmente oder Überreste anderer Zellen enthalten könnten.
Qualitätskontrolle
Bedeutung derAufgrund des schnell steigenden Volumens von veröffentlichten Einzelzell-RNA-Sequenzierungsdaten wird Qualitätskontrolle entscheidend. Die Analyse der MALAT1-Expression bietet eine schnelle Möglichkeit, beschädigte Zellen oder leere Tropfen zu identifizieren und hilft den Forschern, die Integrität ihrer Ergebnisse sicherzustellen.
Ein Standard fürs Filtern von Zellen
Die einfache Überprüfung der MALAT1-Expression sollte zu einer gängigen Praxis in scRNA-seq-Analysepipelines werden. Das würde helfen, die Gesamtqualität der Datensätze zu verbessern und die Wahrscheinlichkeit zu verringern, beschädigte oder leere Zellen fälschlicherweise als intakte Zellen zu identifizieren.
Schlussfolgerungen
Insgesamt zeigt die Verwendung von MALAT1 als Marker vielversprechende Fortschritte in der Methodik der Einzelzell-RNA-Sequenzierung. Durch die Einbeziehung dies in bestehende Filtrationsprozesse können Forscher qualitativ hochwertige Zellen besser identifizieren, was zu zuverlässigeren und informativen Analysen führt. Während sich das Feld weiterentwickelt, wird eine weitere Verfeinerung dieser Techniken unser Verständnis von Genexpression und Zellverhalten in komplexen biologischen Proben nur erweitern.
Titel: MALAT1 expression indicates cell quality in single-cell RNA sequencing data
Zusammenfassung: Single-cell RNA sequencing (scRNA-seq) has revolutionized our understanding of cell types and tissues. However, empty droplets and poor quality cells are often captured in single cell genomics experiments and need to be removed to avoid cell type interpretation errors. Many automated and manual methods exist to identify poor quality cells or empty droplets, such as minimum RNA count thresholds and comparing the gene expression profile of an individual cell to the overall background RNA expression of the experiment. A versatile approach is to use unbalanced overall RNA splice ratios of cells to identify poor quality cells or empty droplets. However, this approach is computationally intensive, requiring a detailed search through all sequence reads in the experiment to quantify spliced and unspliced reads. We found that the expression level of MALAT1, a non-coding RNA retained in the nucleus and ubiquitously expressed across cell types, is strongly correlated with this splice ratio measure and thus can be used to similarly identify low quality cells in scRNA-seq data. Since it is easy to visualize the expression of a single gene in single-cell maps, MALAT1 expression is a simple cell quality measure that can be quickly used during the cell annotation process to improve the interpretation of cells in tissues of human, mouse and other species with a conserved MALAT1 function.
Autoren: Gary Bader, Z. A. Clarke
Letzte Aktualisierung: 2024-07-21 00:00:00
Sprache: English
Quell-URL: https://www.biorxiv.org/content/10.1101/2024.07.14.603469
Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.07.14.603469.full.pdf
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.
Referenz Links
- https://www.10xgenomics.com/datasets
- https://github.com/BaderLab/MALAT1_threshold
- https://github.com/14zac2/MALAT1Analysis
- https://support.10xgenomics.com/single-cell-gene-expression/datasets/4.0.0/Parent_NGSC3_DI_PBMC
- https://support.10xgenomics.com/single-cell-gene-expression/datasets/4.0.0/Parent_NGSC3_DI_HodgkinsLymphoma
- https://www.10xgenomics.com/datasets/7-5-k-sorted-cells-from-human-invasive-ductal-carcinoma-3-v-3-1-3-1-standard-6-0-0
- https://support.10xgenomics.com/single-cell-gene-expression/datasets/4.0.0/Parent_SC3v3_Human_Glioblastoma
- https://data.humancellatlas.org/explore/projects/abe1a013-af7a-45ed-8c26-f3793c24a1f4
- https://zenodo.org/records/3245841
- https://support.10xgenomics.com/single-cell-gene-expression/datasets/4.0.0/SC3_v3_NextGem_DI_Neuron_10K
- https://www.10xgenomics.com/datasets/1-k-heart-cells-from-an-e-18-mouse-v-3-chemistry-3-standard-3-0-0
- https://registry.opendata.aws/tabula-muris-senis/
- https://cellxgene.cziscience.com/collections/0b9d8a04-bb9d-44da-aa27-705bb65b54eb
- https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5
- https://registry.opendata.aws/tabula-sapiens/
- https://cellxgene.cziscience.com/collections/c114c20f-1ef4-49a5-9c2e-d965787fb90c