Similitudes de ARN: Una nueva mirada a los modelos de ratón
Este estudio revela información sobre las similitudes genéticas entre humanos y ratones basada en datos de ARN.
― 7 minilectura
Tabla de contenidos
Los modelos de ratón se usan mucho en investigaciones para estudiar Enfermedades humanas, probar nuevos medicamentos y entender cómo funcionan los genes. Saber cómo los genes humanos y de ratón son similares es clave, especialmente porque ambos han tenido sus genomas secuenciados. Esto significa que podemos mirar el ADN de humanos y ratones y ver qué genes son parecidos.
Sin embargo, solo porque dos genes se vean iguales en su ADN no significa que actúen igual en el cuerpo. Las investigaciones han mostrado que los resultados de estudios en ratones a veces no coinciden con lo que pasa en humanos. Esto puede ser por diferencias en células, órganos o entornos. Además, depender solo de las similitudes en ADN puede no captar cómo funcionan realmente los genes en organismos vivos. Normalmente, los genes trabajan haciendo ARN y Proteínas, y mirar el ARN podría darnos una mejor comprensión de cómo los genes realizan su trabajo.
Enfoque de la investigación
En este estudio, quisimos comparar los genes humanos y de ratón basándonos en datos de ARN. Usamos un montón de datos de ARN de ambas especies: más de 410,000 muestras de humanos y 366,000 de ratones. Nuestro objetivo era crear un método que nos ayudara a ver cuán similares son los genes de humanos y ratones a nivel de ARN. Para hacer esto, usamos técnicas avanzadas de aprendizaje profundo, que permite a las computadoras reconocer patrones en grandes conjuntos de datos.
Creando representaciones de genes
Comenzamos representando genes codificadores de proteínas usando los datos de ARN de ambas especies. Esto se hizo usando un modelo que procesaba enormes cantidades de datos de ARN-seq. Cada gen tendrá una representación única que contiene información sobre su rol biológico. Estas representaciones incluyen detalles sobre enfermedades relacionadas con el gen, cómo interactúa el gen con las proteínas, y otra información biológica vital.
Para que las comparaciones tuvieran sentido, necesitábamos poner las representaciones de genes de ambas especies en el mismo marco. Esto es crucial porque si los genes se representan de manera diferente, se vuelve complicado compararlos.
Alineando representaciones de genes
Implementamos un método de entrenamiento mixto donde se combinaron muestras de ARN de humanos y ratones. En esta configuración, algunos genes de ambas especies aprendieron sus características únicas mientras compartían características generales en el modelo. Al principio, encontramos que aunque el modelo empezaba a acercar las representaciones de los genes humanos y de ratón, seguían en espacios separados, lo que significaba que no podían ser comparados directamente.
Para mejorar aún más la alineación, usamos una estrategia donde genes específicos, conocidos por ser similares entre especies, se forzaron a tener las mismas representaciones. Este enfoque ayudó a acercar aún más las representaciones de los genes, pero aún había margen para mejorar, ya que no estaban completamente alineadas.
Luego, experimentamos con técnicas avanzadas para alinear las representaciones de los genes, que involucraban métodos supervisados donde guiamos la alineación basándonos en las similitudes conocidas entre los genes humanos y de ratón. Esto resultó en un número más significativo de pares de genes análogos alineados estrechamente, mostrando mejor consistencia en la representación de estos genes entre especies.
Analizando relaciones entre genes
Con las incrustaciones de genes ahora en un marco compartido, pudimos analizar las similitudes entre genes humanos y de ratón. Notamos que algunos pares de genes que se veían similares en sus secuencias de ADN también se veían parecidos en sus representaciones de ARN. Sin embargo, encontramos algunos patrones interesantes: ciertos pares de genes mostraban poca semejanza en su ADN pero eran bastante similares en sus datos de ARN. Esto indica que la expresión y función de estos genes podrían estar aún estrechamente relacionadas, a pesar de las diferencias en sus secuencias de ADN.
Nuestras análisis confirmaron que los pares de genes con alta similitud de ARN tienden a tener más información biológica compartida en comparación con aquellos con baja similitud. Esto sugiere que centrarse en similitudes de ARN puede revelar conexiones que las comparaciones de ADN podrían pasar por alto.
Entendiendo el rol de la similitud de genes
La similitud genética puede brindar información sobre enfermedades y condiciones. Cuando miramos datos sobre enfermedades de humanos y ratones, encontramos que los genes con alta similitud de ARN a menudo tenían más asociaciones de enfermedades compartidas. Este hallazgo sugiere que la información derivada del ARN podría ser más beneficiosa para predecir la relevancia de los modelos de ratón para enfermedades humanas específicas.
Probamos además cuán bien nuestras similitudes de ARN podían predecir asociaciones de enfermedades compartidas en comparación con métodos más tradicionales que dependen de datos de ADN. Nuestros resultados indicaron que las similitudes basadas en ARN a menudo superaban estas métricas centradas en el ADN. Este hallazgo es significativo porque significa que los datos de ARN podrían proporcionar una mejor manera de evaluar los modelos de ratón usados para enfermedades humanas.
Extendiendo el análisis
En nuestra investigación, no solo nos enfocamos en genes codificadores de proteínas. También incluimos ARN largos no codificantes y pseudogenes, que son otros tipos de genes que no codifican proteínas. Al incluir estos tipos de genes, pudimos ver cómo existen similitudes y diferencias en una gama más amplia de funciones génicas.
Cuando comparamos las representaciones de genes, encontramos que los genes codificadores de proteínas tenían las mayores similitudes, lo que indica que sus características están bien conservadas entre humanos y ratones. Sin embargo, notamos que otros tipos de genes, como los pseudogenes, mostraron más variabilidad en sus expresiones entre las dos especies.
Esta información podría ser crucial en la investigación biomédica, donde entender las funciones de estos genes no codificantes puede dar lugar a nuevos conocimientos sobre el comportamiento de los genes y los procesos de enfermedad.
Implicaciones para la investigación
Este estudio enfatiza la necesidad de entender las diferencias entre los genes de ratones y humanos al usar modelos de ratón para la investigación de enfermedades humanas. Aunque las similitudes en ADN pueden ser útiles, no son el cuadro completo. Sugerimos que los investigadores también consideren las similitudes en ARN, especialmente al seleccionar modelos de ratón para enfermedades humanas complejas. Nuestros hallazgos implican que algunos genes pueden funcionar de manera bastante diferente incluso si se ven similares a nivel de ADN.
Usar datos de ARN puede brindar a los investigadores valiosos conocimientos sobre las funciones de los genes y ayudar a refinar el uso de modelos animales en la investigación biomédica. De cara al futuro, se anima a los investigadores a integrar comparaciones de ARN junto con estudios tradicionales de ADN para crear una comprensión más completa de cómo se relacionan los genes de diferentes especies.
Conclusión
En general, al alinear las representaciones de genes entre especies usando información de ARN, hemos abierto una puerta para entender mejor las relaciones genéticas inter-especies. Nuestros métodos ofrecen una forma robusta de comparar funciones de genes, lo que podría mejorar la fiabilidad de los modelos de ratón en la investigación de enfermedades humanas. Este estudio resalta la naturaleza compleja de los genes y la importancia de usar un enfoque multifacético en la investigación que abarque tanto datos de ADN como de ARN.
A medida que la investigación sigue evolucionando, integrar estas técnicas avanzadas será esencial para descubrir insights biológicos más profundos y mejorar nuestra comprensión de las funciones de los genes entre diferentes especies.
Título: Genes in Humans and Mice: Insights from Deep learning of 777K Bulk Transcriptomes
Resumen: Mice are widely used as animal models in biomedical research, favored for their small size, ease of breeding, and anatomical and physiological similarities to humans1,2. However, discrepancies between mouse gene experimental results and the actual behavior of human genes are not uncommon, despite their shared DNA sequence similarity3-8. This suggests that DNA sequence similarity does not always reliably predict functional similarity. On the other hand, RNA-level gene expression could offer additional information about gene function9,10. In this study, we undertook characterization and inter-species comparison of human and mouse genes by applying innovative deep learning methodologies to a large dataset of 410K human and 366K mouse bulk RNA-seq samples. This was achieved by using gene representations from our Transformer-based GeneRAIN model11,12. These gene representations aggregate information from large gene expression datasets, and provide insights beyond DNA sequence similarity. We identified 2,407 human-mouse homologous genes with high DNA similarity but distinct RNA characteristics, and showed that these genes are more likely to have differing disease/phenotype associations between the two species. Additionally, we found 3,070 homologous genes with low similarity at both the DNA and RNA levels, suggesting the highest risk of discrepancies in study results between the two species. We propose that this approach will support future decision making around whether the mouse will be an appropriate model for studying specific human genes, and whether the results of specific mouse gene studies are likely to be recapitulated in humans. Our methodological innovations offer valuable lessons for future deep learning applications in cross-species omics data. The interspecies gene relationship findings from our study also contribute valuable insights into the gene biology and evolution of the two species.
Autores: Emily Oates, Z. Su, M. Fang, A. Smolnikov, F. Vafaee, M. E. Dinger
Última actualización: 2024-07-19 00:00:00
Idioma: English
Fuente URL: https://www.biorxiv.org/content/10.1101/2024.04.01.587517
Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.04.01.587517.full.pdf
Licencia: https://creativecommons.org/licenses/by-nc/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.