Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Genómica

Descubriendo el papel de las pequeñas proteínas en las bacterias

La investigación revela la importancia de las proteínas pequeñas en la función y evolución de las bacterias.

― 9 minilectura


Revelando MicroproteínasRevelando MicroproteínasBacterianasfunción en bacterias.Proteínas pequeñas muestran evolución y
Tabla de contenidos

Pequeños marcos de lectura abiertos, o smORFs, son fragmentos cortos de código genético que pueden producir proteínas, generalmente más pequeñas de 100 aminoácidos en eucariotas y más cortas de 50 a 70 en procariotas. Estas proteínas diminutas, a menudo llamadas microproteínas, aún están bastante inexploradas y no se entienden bien en la mayoría de los organismos.

La investigación ha demostrado que los smORFs traducidos existen en varias partes dentro de los genomas de diferentes organismos. Aun así, muchos de los roles biológicos de estas microproteínas son poco claros. A menudo son difíciles de distinguir del ruido aleatorio en la traducción. A pesar de esto, algunos estudios han caracterizado un puñado de microproteínas en diferentes seres vivos, como animales, plantas, hongos y bacterias.

Un esfuerzo reciente de una comunidad de investigación llevó a la creación de un catálogo que contiene más de 7,000 smORFs humanos que fueron validados. Esto resalta la importancia de entender las pequeñas proteínas dentro del contexto más amplio de la biología.

El Papel de los Microbiomas en la Identificación de Pequeñas Proteínas

Los estudios de microbiomas han revelado decenas de miles de pequeñas proteínas en bacterias. En los genomas procariotas, hay segmentos llamados smORFs intergénicos (ismORFs) que podrían ser una fuente significativa de nuevas proteínas que provienen de secciones no codificantes del ADN. Estas proteínas podrían estar implicadas en varias funciones celulares, aunque los estudios sistemáticos enfocados en los ismORFs procariotas han sido limitados.

La idea del nacimiento de genes de novo, donde nuevos genes surgen de la nada, se cree que es un factor clave en el desarrollo de microproteínas. La mayoría de las microproteínas que provienen de smORFs parecen ser relativamente jóvenes en términos de evolución. Los investigadores han explorado estos procesos en varias especies, incluidos humanos y plantas, pero no hay una comprensión completa de cómo el nacimiento y la pérdida de genes impactan la dinámica de las microproteínas, especialmente en bacterias.

En esta investigación, los científicos analizaron millones de ismORFs que son más largos de 15 aminoácidos en genomas bacterianos, particularmente de la familia Enterobacteriaceae. Caracterizaron estas microproteínas bacterianas ocultas y evaluaron cómo podrían interactuar estas pequeñas proteínas con proteínas más grandes y funcionalmente establecidas.

Entendiendo las Secuencias Intergénicas

Las secuencias intergénicas, o regiones entre genes, son generalmente cortas y ricas en adenina y timina. Las microproteínas jóvenes codificadas por smORFs se encuentran frecuentemente en territorios inexplorados de los genomas bacterianos. En consecuencia, los investigadores se centraron en regiones intergénicas como una posible fuente de pequeñas proteínas no descubiertas y nuevos genes.

En su estudio, extrajeron secuencias intergénicas de 5668 genomas bacterianos pertenecientes a 23 géneros de la familia Enterobacteriaceae. Un total de más de 17 millones de secuencias intergénicas fueron seleccionadas para análisis. Estas secuencias intergénicas mostraron una longitud promedio de aproximadamente 200 nucleótidos, lo que indica que son lo suficientemente largas como para albergar muchas microproteínas pero no proteínas más grandes.

Proceso para Identificar Marcos de Lectura Abiertos Pequeños

Para identificar y analizar los ismORFs, el estudio empleó un enfoque sistemático. Se utilizaron más de 17 millones de secuencias intergénicas de los géneros bacterianos seleccionados para predecir los ismORFs. Las microproteínas predichas se agruparon en casi un millón de clústeres basados en similitudes en sus secuencias.

El estudio calculó el Contenido de GC de las secuencias codificantes en los 23 géneros, notando una amplia variación en los niveles de GC entre especies. Encontró que el contenido de AT en las secuencias intergénicas era consistentemente más alto que en las secuencias codificantes. Esta composición de bases influye en las características de las microproteínas, ya que estas secuencias favorecen la creación de microproteínas hidrofóbicas.

Predicciones a partir de Regiones Intergénicas

El estudio estableció un umbral de tamaño de 40 aminoácidos para la inclusión de proteínas en bases de datos. Sin embargo, incluso las pequeñas proteínas bacterianas de tan solo 15 aminoácidos pueden ser funcionales. En total, los investigadores identificaron alrededor de 45 millones de ismORFs bacterianos que oscilaron entre 15 y 70 codones de longitud. Llamaron a estas proteínas hipotéticas microproteínas.

Evaluaron la longitud promedio de estas microproteínas y encontraron que generalmente eran más cortas que la longitud promedio de pequeñas proteínas ya catalogadas en bases de datos. Esto sugirió que las predicciones hechas para las microproteínas eran válidas, aunque se encontraran proteínas pequeñas más largas con mayor frecuencia en las bases de datos existentes.

Análisis de Familias de Microproteínas

Investigaciones anteriores sugieren que los genomas pueden contener varios tipos de microproteínas potencialmente traducidas. Para diferenciar entre ismORFs aleatorios y aquellos que probablemente codifican proteínas, el estudio examinó firmas de selección evolutiva como indicadores de microproteínas funcionales.

Usando una serie de métodos, asignaron puntajes evolutivos a los ismORFs. Los investigadores descubrieron varios clústeres de estas microproteínas predichas, lo que indicaba que un número significativo de ellas podría codificar realmente proteínas en línea con las funciones observadas en proteínas más grandes.

Prediciendo el Potencial de Codificación

El estudio utilizó dos herramientas computacionales para predecir qué ismORFs codificaban microproteínas. La primera herramienta, RNAcode, identificó alrededor del 3% de los clústeres de microproteínas como codificantes, pero este método sufría de una alta tasa de falsos negativos. Para mejorar esto, los investigadores también desarrollaron un enfoque alternativo llamado EvolScore, que se basaba en calcular cuidadosamente varias métricas evolutivas.

Los resultados mostraron una superposición significativa entre las microproteínas predichas como codificantes utilizando ambos métodos, lo que permitió a los investigadores compilar un conjunto de datos más completo de microproteínas potencialmente codificantes.

Familias de Microproteínas Predichas

Los investigadores utilizaron tasas evolutivas para evaluar la dinámica y conservación de estas pequeñas proteínas dentro de los genomas. Los datos sugirieron que muchas microproteínas habían experimentado selección purificadora, mientras que otras mostraban signos de selección positiva. Esto apuntó a la posibilidad de que algunas microproteínas pudieran desarrollar funciones a lo largo del tiempo.

Para analizar la conservación de microproteínas, los investigadores buscaron determinar cuántas de ellas ocupaban las mismas posiciones genéticas en diversas cepas. Al identificar regiones sinécticas, evaluaron con qué frecuencia estos ismORFs mantenían consistencia en diferentes genomas, concluyendo que la mayoría de ellos eran probablemente específicos de linaje.

Evidencia de Transcripción y Traducción

La investigación examinó además datos disponibles de secuenciación de ARN para buscar evidencia de transcripción de estos ismORFs. La mayoría de los ismORFs identificados mostraron algún nivel de actividad transcripcional, que se encontró en general significativamente más bajo que el de los genes anotados.

Al verificar la traducción, los investigadores recurrieron a experimentos de perfilado de ribosomas. Descubrieron que un porcentaje menor de los ismORFs mostraba señales de ser traducidos en comparación con las pequeñas proteínas anotadas. Esto planteó preguntas sobre la funcionalidad y regulación de estas pequeñas proteínas.

Características y Predicciones de Microproteínas

Los hallazgos mostraron que muchas de las microproteínas predichas eran hidrofóbicas por naturaleza y mostraban pocas características funcionales conocidas. Se realizaron predicciones estructurales para evaluar las formas físicas que estas microproteínas podrían adoptar.

AlphaFold2, una herramienta para predecir estructuras de proteínas, fue empleada para entender cómo podrían doblarse o interactuar estas microproteínas. La mayoría de las microproteínas predichas exhibieron estructuras simples, a menudo compuestas principalmente de hélices alfa, mientras que algunas se encontraron con pliegues más intrincados.

Interacciones de Microproteínas en la Respuesta al Estrés

El estudio analizó cómo las microproteínas podrían responder a condiciones ambientales cambiantes, particularmente estrés. Al revisar datos de varias cepas de bacterias bajo diferentes condiciones de estrés, identificaron numerosos ismORFs que mostraron expresión diferencial en tales circunstancias.

Esto llevó a la hipótesis de que las microproteínas podrían desempeñar roles cruciales durante tiempos de estrés al interactuar con complejos proteicos más grandes. Las interacciones entre microproteínas y proteínas más grandes fueron simuladas computacionalmente para predecir posibles roles cooperativos que podrían desempeñar.

Conclusión: Un Recurso para Entender los Microproteomas Bacterianos

Este trabajo resalta una área de la genética que ha sido subestimada al explorar los microproteomas de las bacterias. Los hallazgos sugieren un paisaje dinámico de pequeñas proteínas que pueden evolucionar rápidamente y potencialmente desempeñar funciones esenciales en procesos celulares.

Los datos recopilados proporcionan un recurso robusto para estudios futuros, permitiendo a los investigadores profundizar más en las características y roles de estas pequeñas proteínas. Al entender el potencial de codificación, la sincronía y la conservación evolutiva de las microproteínas, la investigación futura puede arrojar luz sobre su importancia biológica y aplicaciones en varios campos.

Limitaciones de la Investigación

Aunque extensa, esta investigación tiene limitaciones principalmente asociadas con los desafíos computacionales enfrentados al analizar grandes cantidades de datos. El estudio se centró principalmente en una familia específica de bacterias, dejando el potencial de diferentes tendencias en otros organismos procariotas sin explorar. Además, los hallazgos sobre interacciones y funciones de las microproteínas deben someterse a una validación experimental adicional para entender completamente sus roles.

Pensamientos Finales

El mundo intrincado de las pequeñas proteínas está saliendo a la luz, revelando un área rica en descubrimientos potenciales que pueden mejorar nuestro conocimiento de la genética y las funciones proteicas. La colaboración entre predicciones computacionales y validaciones experimentales sin duda impulsará la exploración de este fascinante campo hacia adelante.

Fuente original

Título: The Cryptic Bacterial Microproteome

Resumen: Microproteins encoded by small open reading frames (smORFs) comprise the "dark matter" of proteomes. Although functional microproteins were identified in diverse organisms from all three domains of life, bacterial smORFs remain poorly characterized. In this comprehensive study of intergenic smORFs (ismORFs, 15-70 codons) in 5,668 bacterial genomes of the family Enterobacteriaceae, we identified 67,297 clusters of ismORFs subject to purifying selection. The ismORFs mainly code for hydrophobic, potentially transmembrane, unstructured, or minimally structured microproteins. Using AlphaFold Multimer, we predicted interactions of some of the predicted microproteins encoded by transcribed ismORFs with proteins encoded by neighboring genes, revealing the potential of microproteins to regulate the activity of various proteins, particularly, under stress. We compiled a catalog of predicted microprotein families with different levels of evidence from synteny analysis, structure prediction, and transcription and translation data. This study offers a resource for investigation of biological functions of microproteins. HighlightsO_LIThousands of previously unknown bacterial microproteins predicted C_LIO_LIMost microproteins belong to lineage-specific families, revealing unexplored diversity of bacterial proteomes C_LIO_LIComparative genome analysis suggests de novo emergence of numerous microproteins C_LIO_LIInteractions between stress-induced microproteins and known functional proteins predicted C_LIO_LIThis study provides a resource to investigate cryptic bacterial microproteomes C_LI

Autores: Eugene V. Koonin, I. Fesenko, H. Sahakyan, S. A. Shabalina

Última actualización: 2024-02-18 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2024.02.17.580829

Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.02.17.580829.full.pdf

Licencia: https://creativecommons.org/publicdomain/zero/1.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares