Avances en la edición genética para mejorar los cultivos
La edición genética mejora la resistencia de los cultivos, el uso de recursos y la nutrición.
― 6 minilectura
Tabla de contenidos
- La Complejidad del Control Genético
- Enfoques para Identificar Secuencias Reguladoras
- El Papel de la Cromatina Abierta
- Aprendizaje Automático en la Predicción de Expresión Génica
- Construyendo un Modelo Transformador
- Analizando la Importancia de los Nucleótidos del ADN
- La Importancia de las Regiones No Codificantes
- Mirando Hacia el Futuro
- Conclusión
- Fuente original
La Edición genética tiene un gran potencial para mejorar los cultivos. Puede ayudar a crear plantas más fuertes, que usen los recursos de manera más eficiente y que ofrezcan mejor nutrición. Sin embargo, para aprovechar al máximo la edición genética, necesitamos hacer más que solo cambiar partes específicas del ADN. También debemos entender cómo se controlan los genes y cómo se expresan en diferentes situaciones.
La Complejidad del Control Genético
En el ADN, hay partes que codifican proteínas y otras que no. Las secuencias que codifican proteínas son más fáciles de identificar y estudiar. Los científicos han avanzado en descubrir qué cambios en estas partes codificantes afectarán cómo funcionan las proteínas. Pero cuando se trata de las áreas No codificantes que controlan cuándo y cuánto se convierten las secuencias codificantes en ARN mensajero, se vuelve mucho más complicado. Estas regiones reguladoras juegan un papel crucial, pero entenderlas sigue siendo un gran desafío.
Enfoques para Identificar Secuencias Reguladoras
Hay al menos dos estrategias principales que se utilizan para encontrar estas partes no codificantes del ADN. Un enfoque busca secuencias no codificantes que permanezcan sin cambios a lo largo del tiempo en diferentes especies. Este método, conocido como identificación de secuencias no codificantes conservadas, ayuda a detectar regiones que son cruciales para la función del gen. El segundo método implica observar regiones de Cromatina abierta, que son partes del ADN que son accesibles para la Expresión génica.
Los científicos comparan el ADN de plantas relacionadas para encontrar estas regiones importantes. Las secciones no codificantes que evolucionan lentamente suelen estar vinculadas a la regulación de genes cercanos. Sin embargo, las secuencias reguladoras más nuevas no aparecerán como conservadas. Las piezas más pequeñas reconocidas como importantes en las plantas suelen ser más grandes que los sitios donde las proteínas se unen al ADN.
El Papel de la Cromatina Abierta
Se han estudiado regiones de cromatina abierta utilizando varias técnicas de secuenciación. Estas áreas suelen contener una gran cantidad de marcadores genéticos que están relacionados con diferentes características de las plantas. Pero muchos métodos actuales identifican segmentos más grandes de ADN, lo que significa que pueden capturar más que solo las secuencias reguladoras clave.
Aprendizaje Automático en la Predicción de Expresión Génica
En los últimos años, el aprendizaje automático ha hecho posible predecir la expresión génica basado en secuencias de ADN. Estos modelos pueden determinar cuál de dos genes será más activo según la secuencia de ADN cercana. Por ejemplo, los científicos han utilizado estos enfoques con éxito en maíz, un cultivo importante, para predecir cómo reaccionarán los genes ante el estrés u otras condiciones.
Sin embargo, predecir patrones detallados de expresión génica basado solo en la secuencia de ADN ha demostrado ser más complicado. Algunos modelos han mostrado un éxito parcial, pero la precisión de estas predicciones puede variar. Un modelo mostró mejores resultados que los controles, pero aún le costaba predecir exactamente cuánto se expresan diferentes genes en varios tejidos.
Construyendo un Modelo Transformador
Para hacer las predicciones más precisas, se creó un nuevo modelo que puede predecir cuánto se expresan genes individuales de maíz en diferentes tejidos. Este modelo utiliza un rango más amplio de ADN que rodea cada gen, extendiéndose lejos de los puntos de inicio y fin del gen. Al dividir cuidadosamente los conjuntos de datos para evitar superposiciones, los investigadores pudieron evaluar qué tan bien funcionaba su modelo.
El modelo superó a pruebas más simples por un margen significativo al observar datos de expresión génica. Sin embargo, las predicciones no se sostenían tan bien cuando solo se examinaban segmentos más pequeños de ADN.
Analizando la Importancia de los Nucleótidos del ADN
Para comprender mejor qué partes específicas del ADN son cruciales para la expresión génica, el modelo examinó la importancia de nucleótidos individuales en relación con marcadores de función reguladora. Estos marcadores incluyen secuencias no codificantes conservadas y áreas de cromatina abierta. Los datos de varios genes de maíz mostraron que muchas secuencias no codificantes importantes coincidían con puntuaciones más altas de importancia de nucleótidos.
Al comparar los resultados de maíz y otra planta relacionada, el sorgo, surgieron patrones similares. El modelo entrenado en maíz aún podía predecir niveles de expresión en tejidos de sorgo, lo que indica que algunos factores reguladores son compartidos entre las dos especies.
La Importancia de las Regiones No Codificantes
Las regiones no codificantes juegan un papel vital en definir cómo se expresan los genes. Aunque muchos estudios se han centrado en las partes cercanas del ADN, hay evidencia creciente de que las regiones no codificantes más distantes también son importantes. Al usar segmentos más grandes de ADN, los investigadores podrían identificar conexiones entre secuencias reguladoras y expresión génica.
Este enfoque puede ayudar a los científicos a aprender cómo editar mejor los genes considerando todo el paisaje del ADN. Entender estos elementos reguladores puede ayudar a explicar por qué diferentes plantas muestran características variadas, lo cual es crucial para mejorar los cultivos y su resistencia en climas cambiantes.
Mirando Hacia el Futuro
El estudio de la edición y regulación genética sigue evolucionando con los avances en tecnología y técnicas. A medida que los investigadores aprenden más sobre cómo analizar efectivamente segmentos más grandes de ADN y aplicar el aprendizaje automático, podemos esperar hacer un progreso significativo en la mejora de cultivos.
Al combinar el conocimiento de ADN codificante y no codificante, los científicos pueden desarrollar mejores estrategias para mejorar las prácticas agrícolas. Esta comprensión será vital para enfrentar los desafíos de la seguridad alimentaria y cultivar plantas resistentes que puedan prosperar en condiciones cambiantes.
Conclusión
La edición genética tiene mucho potencial para cambiar la agricultura para mejor. Sin embargo, para realizar su completo potencial, se requiere una comprensión más profunda de la compleja red de regulación genética. Al centrarse tanto en los genes como en sus regiones reguladoras, los científicos pueden trabajar en crear cultivos que sean no solo más productivos, sino también más sostenibles. Los esfuerzos por cerrar la brecha entre las partes codificantes y no codificantes del genoma llevarán a prácticas agrícolas más informadas y efectivas en el futuro.
Título: Models trained to predict differential expression across plant organs identify distal and proximal regulatory regions
Resumen: AO_SCPLOWBSTRACTC_SCPLOWA large proportion of standing phenotypic variation is explained by genetic variation in noncoding regulatory regions. However, tools for the automated identification and characterization of noncoding regulatory sequences in genomes have lagged far behind those employed to annotate and predict the functions of protein coding sequences. We developed a modified transformer model and trained it to predict relative patterns of expression across a diverse set of tissues given a large sequence window for each gene of interest in the maize (Zea mays) genome. Nucleotides in the input DNA sequence with high saliency in gene expression pattern prediction overlapped with regions identified via comparative genomic or chromatin-based approaches as potential regulatory sequences. High saliency regions identified in a second species, sorghum (Sorghum bicolor), without species-specific training were also associated with potential regulatory sequences in noncoding regions upstream and downstream of each gene of interest. The potential impact of a scaleable and transferable approach to identifying regulatory sequences using saliency calculated from large context window models spans multiple applications. Specific use cases could include genome annotation, interpretation of natural genetic variation, and targeted editing in noncoding regions to alter patterns of levels of gene expression.
Autores: James C Schnable, M. C. Tross, G. Duggan, N. Shrestha
Última actualización: 2024-06-06 00:00:00
Idioma: English
Fuente URL: https://www.biorxiv.org/content/10.1101/2024.06.04.597477
Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.06.04.597477.full.pdf
Licencia: https://creativecommons.org/licenses/by-nc/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.