Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Bioinformática

Usando MALAT1 para Mejorar la Calidad de los Datos de scRNA-seq

La expresión de MALAT1 ayuda a identificar células de alta calidad en la secuenciación de ARN de una sola célula.

― 7 minilectura


MALAT1 mejora la calidadMALAT1 mejora la calidadcelular en scRNA-seqevaluar la integridad celular.MALAT1 es un marcador clave para
Tabla de contenidos

La secuenciación de ARN de una sola célula (ScRNA-seq) es una técnica que se usa para estudiar la expresión genética en células individuales. Este método ayuda a los científicos a entender cómo se comportan las diferentes células en una muestra y en qué se diferencian entre sí. Sin embargo, ciertos factores pueden afectar la calidad de los datos obtenidos de estos experimentos.

Desafíos en scRNA-seq

Un desafío importante en scRNA-seq es asegurarse de que el ARN detectado en una célula provenga efectivamente de esa célula específica. Algunos métodos para aislar células pueden llevar a la contaminación, donde el ARN de otras fuentes fuera de la célula interfiere con los resultados. Este problema puede surgir durante la etapa de procesamiento celular.

Fuentes de Contaminación

Al usar métodos basados en gotas para scRNA-seq, las células pueden liberar ARN en la solución circundante. Este ARN liberado, conocido como ARN ambiental, puede mezclarse con el ARN de las células, dificultando la determinación de a qué célula pertenece cada ARN. A veces, las gotas destinadas a capturar células pueden llenarse en cambio con este ARN ambiental, llevando a identificaciones erróneas.

Además, ciertos tipos de células son más propensas a romperse durante el procesamiento, liberando su ARN. Esto puede causar problemas, ya que las gotas dañadas o vacías que contienen fragmentos de células pueden aún pasar por los procesos de selección inicial, ocasionando resultados poco fiables.

Identificación de Células en scRNA-seq

En los experimentos típicos de scRNA-seq, se producen un gran número de gotas. Solo algunas de estas gotas contienen células intactas. Los investigadores buscan gotas que tengan altos conteos de identificadores moleculares únicos (UMIs) para identificar la presencia de células. También pueden usar métodos estadísticos para comparar el perfil de ARN de las gotas con un perfil de fondo para ayudar con la identificación.

Filtrado de Gotas Problemáticas

Para asegurar la calidad de los datos, los investigadores a menudo eliminan las gotas que contienen múltiples células, conocidas como dobles, o aquellas que muestran signos de daño celular. Sin embargo, incluso después de aplicar estos filtros, muchos conjuntos de datos aún contienen células que no están intactas o están mezcladas con ARN ambiental, llevando a resultados pobres.

Introducción de DropletQC

Para ayudar a resolver el problema de las células dañadas, se desarrolló una herramienta llamada DropletQC. Esta evalúa la calidad de las células según su fracción nuclear, que es una medida de la relación entre su ARN citoplasmático y su ARN nuclear. Si las gotas muestran bajos niveles de ARN nuclear, pueden ser identificadas como vacías o que contienen células dañadas.

Aunque DropletQC es útil, requiere mucha potencia computacional para procesar grandes cantidades de datos. Además, el acceso a los datos de secuenciación en bruto puede ser limitado a veces, haciendo que el reanálisis de conjuntos de datos existentes sea un desafío.

Nuevos Enfoques para Filtrar Células

Desde el lanzamiento de DropletQC, han surgido otros métodos para mejorar el filtrado de células. Por ejemplo, SampleQC analiza la distribución de características de ARN dentro de los tipos celulares e identifica valores atípicos que no coinciden con patrones esperados. Otro método, QClus, examina múltiples métricas de calidad en los datos para señalar células con bajos niveles de ARN no empalmado.

El Papel de MALAT1

MALAT1 es un tipo específico de ARN conocido como ARN largo no codificante (lncRNA) que se encuentra principalmente en el núcleo. Se expresa de manera consistente en muchos tipos de células y está involucrado en procesos celulares importantes.

Los investigadores encontraron que el nivel de expresión de MALAT1 se correlaciona bien con la fracción nuclear de las células. Esto significa que al medir los niveles de MALAT1, los científicos pueden evaluar rápidamente si una gota probablemente contiene un núcleo celular intacto.

MALAT1 como Indicador de Calidad

El análisis de datos mostró que la expresión de MALAT1 es uno de los indicadores más fiables de la calidad celular en experimentos de scRNA-seq. Las células con bajas expresiones de MALAT1 a menudo son señaladas para un examen más detallado, ya que pueden ser gotas vacías o dañadas. En muchos conjuntos de datos, la correlación entre la expresión de MALAT1 y la fracción nuclear es fuerte, sugiriendo que sirve como una medida efectiva para identificar células intactas.

Uso de MALAT1 para Filtrar Células

Los investigadores examinaron si podían automatizar el proceso de identificar células de baja calidad basándose en los niveles de expresión de MALAT1. Encontraron que una vez que se normalizan las lecturas de ARN, MALAT1 tiende a mostrar un patrón específico de expresión. Los conjuntos de datos con niveles de MALAT1 que caen por debajo de un cierto umbral pueden ser señalados para revisión o eliminación, ya que estos valores bajos típicamente indican gotas vacías o células que carecen de núcleos.

Estimando el Umbral de MALAT1

Se desarrolló un método gráfico para ayudar a estimar el umbral por debajo del cual las células deberían ser señaladas. Al analizar la distribución de la expresión de MALAT1 en el conjunto de datos, los investigadores pueden identificar un límite inferior. Las células que caen por debajo de este límite probablemente no están intactas.

Análisis de Varios Conjuntos de Datos

Al aplicar este proceso de filtrado de MALAT1 a varios conjuntos de datos, los investigadores observaron hallazgos consistentes entre muestras saludables y enfermas. En particular, ciertos tipos de células, como las células hepáticas y los eritrocitos, tendían a mostrar niveles bajos de expresión de MALAT1, sirviendo como control para el modelo de filtrado.

Tipos Celulares Específicos y Niveles de MALAT1

Ciertos tejidos pueden presentar desafíos al analizar la calidad de las células. Por ejemplo, las células hepáticas a menudo expresan bajos niveles de MALAT1 debido a su fragilidad durante el procesamiento. Esto puede llevar a la identificación incorrecta de células, ya que el ARN ambiental puede contaminar los resultados.

En muchos conjuntos de datos, se identificaron grupos de células que expresan altos niveles de MALAT1, indicando núcleos intactos. Por el contrario, los grupos con bajos niveles de MALAT1 a menudo fueron señalados por daño potencial, sugiriendo que pueden contener fragmentos o restos de otras células.

Importancia del Control de Calidad

Debido al volumen cada vez mayor de datos de secuenciación de ARN de una sola célula que se publican, el control de calidad se vuelve crucial. El análisis de la expresión de MALAT1 proporciona una forma rápida de identificar células dañadas o gotas vacías, ayudando a los investigadores a asegurar la integridad de sus resultados.

Un Estándar para Filtrar Células

La simple verificación de la expresión de MALAT1 debería convertirse en una práctica común en los procesos de análisis de scRNA-seq. Esto ayudaría a mejorar la calidad general de los conjuntos de datos y reducir las posibilidades de identificar erróneamente células dañadas o vacías como células intactas.

Reflexiones Finales

En general, el uso de MALAT1 como marcador muestra el potencial de avanzar en la metodología utilizada en la secuenciación de ARN de una sola célula. Al incorporar esto en los procesos de filtrado existentes, los investigadores pueden identificar mejor las células de alta calidad, llevando a análisis más fiables e informativos. A medida que el campo evoluciona, el perfeccionamiento de estas técnicas solo mejorará nuestra comprensión de la expresión genética y el comportamiento celular en muestras biológicas complejas.

Fuente original

Título: MALAT1 expression indicates cell quality in single-cell RNA sequencing data

Resumen: Single-cell RNA sequencing (scRNA-seq) has revolutionized our understanding of cell types and tissues. However, empty droplets and poor quality cells are often captured in single cell genomics experiments and need to be removed to avoid cell type interpretation errors. Many automated and manual methods exist to identify poor quality cells or empty droplets, such as minimum RNA count thresholds and comparing the gene expression profile of an individual cell to the overall background RNA expression of the experiment. A versatile approach is to use unbalanced overall RNA splice ratios of cells to identify poor quality cells or empty droplets. However, this approach is computationally intensive, requiring a detailed search through all sequence reads in the experiment to quantify spliced and unspliced reads. We found that the expression level of MALAT1, a non-coding RNA retained in the nucleus and ubiquitously expressed across cell types, is strongly correlated with this splice ratio measure and thus can be used to similarly identify low quality cells in scRNA-seq data. Since it is easy to visualize the expression of a single gene in single-cell maps, MALAT1 expression is a simple cell quality measure that can be quickly used during the cell annotation process to improve the interpretation of cells in tissues of human, mouse and other species with a conserved MALAT1 function.

Autores: Gary Bader, Z. A. Clarke

Última actualización: 2024-07-21 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2024.07.14.603469

Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.07.14.603469.full.pdf

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Artículos similares