Avances en Filogenómica y Relaciones Evolutivas
Examinando cómo las nuevas técnicas mejoran nuestra comprensión de las conexiones entre especies.
― 7 minilectura
Tabla de contenidos
- La Evolución de la Filogenómica
- Hallazgos Clave en la Investigación Temprana de Filogenómica
- El Desafío de los Árboles Genéticos Conflictivos
- Métodos para Mejorar los Análisis Filogenómicos
- Recolección y Análisis de Datos
- Rendimiento de Diferentes Análisis Filogenómicos
- Abordando los Datos Faltantes y Su Impacto
- El Papel de las Métricas de Distancia en el Análisis
- Conclusión
- Fuente original
- Enlaces de referencia
La filogenética es el estudio de las relaciones evolutivas entre las especies. Ayuda a los científicos a entender cómo diferentes especies están relacionadas entre sí según su información genética. Con los avances en tecnología, los investigadores ahora pueden analizar grandes cantidades de datos genéticos, lo que ha llevado al desarrollo de un campo más especializado llamado Filogenómica. Este campo utiliza datos de genomas completos, o grandes partes de ellos, para crear representaciones más precisas de cómo están conectadas las especies.
La Evolución de la Filogenómica
Los primeros estudios en filogenética a menudo se basaban en un pequeño número de genes para estimar relaciones. Sin embargo, a medida que la tecnología mejoró, los investigadores comenzaron a usar datos de muchos genes a la vez. Este cambio permitió la creación de árboles filogenéticos más sólidos, que son representaciones visuales de las relaciones entre especies. A pesar de estos avances, aún surgieron conflictos al comparar árboles generados a partir de diferentes conjuntos de genes.
Hallazgos Clave en la Investigación Temprana de Filogenómica
La investigación reveló tres hallazgos significativos en el campo de la filogenómica. Primero, usar datos de múltiples genes típicamente producía árboles que tenían un fuerte apoyo, lo que significa que las relaciones ilustradas en estos árboles eran confiables. Segundo, cuando se analizaban regiones genéticas individuales por separado, a menudo mostraban árboles conflictivos. Esto indicó que diferentes genes pueden contar historias distintas sobre las relaciones evolutivas. Por último, los investigadores encontraron que los árboles generados a partir de diferentes métodos analíticos o conjuntos de datos también podían mostrar conflictos, resaltando la complejidad de entender la historia evolutiva.
La presencia de estos conflictos generalmente apunta a error sistemático, que es un problema donde el método analítico utilizado tiene fallas de una manera que representa incorrectamente las verdaderas relaciones. La atracción de ramas largas, un tipo específico de error, ocurre cuando especies no relacionadas parecen estar cercanamente relacionadas porque han desarrollado rasgos similares de forma independiente.
El Desafío de los Árboles Genéticos Conflictivos
Los conflictos entre árboles genéticos individuales pueden surgir por varios factores. Un factor es el error estocástico, que ocurre cuando los datos de un gen específico no son suficientes para retratar con precisión su historia evolutiva. Sin embargo, las fuentes biológicas de discordia también pueden crear estos conflictos. Por ejemplo, el sorting de linaje incompleto es un proceso natural que puede llevar a que diferentes genes muestren relaciones variadas entre especies. La duplicación de genes y la transferencia horizontal de genes son otros procesos que pueden causar discrepancias en las filogenias estimadas.
Los árboles genéticos conflictivos pueden complicar la determinación de un Árbol de especies, que es un diagrama que ilustra las relaciones evolutivas entre especies. Estos conflictos pueden llevar a errores en los análisis cuando se utilizan métodos sencillos que asumen un solo árbol evolutivo.
Métodos para Mejorar los Análisis Filogenómicos
Para abordar los desafíos que presentan los árboles genéticos conflictivos, se han desarrollado nuevos métodos. Uno de los métodos implica usar un enfoque de coalescencia multispecies, que toma en cuenta procesos como el sorting de linaje incompleto de una manera más sofisticada. Este método mejora la estimación de los árboles de especies al integrar información de múltiples árboles genéticos y reconocer las complejidades de la historia evolutiva.
Otro método implica crear árboles resumen a partir de árboles genéticos, donde se utilizan las relaciones más consistentes entre los árboles genéticos para estimar un árbol de especies. Este enfoque permite una comprensión más matizada de las relaciones evolutivas, incluso cuando algunos árboles genéticos están en conflicto.
Recolección y Análisis de Datos
Para llevar a cabo un análisis completo de datos filogenómicos, los investigadores recopilan información genética de una amplia variedad de especies. Los datos a menudo provienen de regiones específicas del ADN conocidas como elementos ultraconservados, que están altamente preservados en diferentes especies. Al centrarse en estas regiones, los científicos pueden reunir información genética importante que puede compararse entre muchos taxones.
Una vez que se recopilan los datos genéticos, pasan por un proceso de limpieza minucioso para eliminar cualquier secuencia de mala calidad. Luego, los investigadores alinean las secuencias para identificar similitudes y diferencias entre especies. Esta alineación es crucial para estimar con precisión los árboles filogenéticos.
Rendimiento de Diferentes Análisis Filogenómicos
Los investigadores evalúan el rendimiento de varios métodos analíticos según qué tan eficazmente recuperan relaciones evolutivas conocidas. En pruebas que involucraban aves como ejemplo principal, uno de los métodos tradicionales utilizados fue el análisis de máxima verosimilitud. Este método funcionó bien para la mayoría de las ramas de los árboles filogenéticos, indicando que podía recuperar muchas relaciones de manera confiable.
Sin embargo, se probaron métodos más nuevos, como los métodos de resumen de árboles genéticos y los métodos de coalescencia multispecies, para ver qué tan bien recuperaban relaciones entre aves. Estos métodos tuvieron un rendimiento diferente, algunos siendo más efectivos en recuperar relaciones cercanas mientras que otros tenían dificultades con conexiones evolutivas más profundas.
METAL, otro método que utiliza medidas de distancia entre especies para estimar relaciones de árboles, enfrentó desafíos al manejar Datos faltantes. Los datos faltantes pueden impactar negativamente la estimación de longitudes de ramas y la precisión general del árbol resultante.
Abordando los Datos Faltantes y Su Impacto
Los datos faltantes son un problema común en estudios filogenómicos, especialmente al tratar con grandes conjuntos de datos. En algunos casos, ciertos taxones pueden tener extensos vacíos en los datos, dificultando sacar conclusiones confiables sobre sus relaciones. Varias estrategias pueden ayudar a mitigar el impacto de los datos faltantes, incluyendo seleccionar cuidadosamente qué taxones incluir en los análisis y optar por conjuntos de datos que tengan mejor cobertura en general.
Cuando los investigadores eliminaron taxones mal muestreados de sus conjuntos de datos, encontraron mejoras en el rendimiento de muchos análisis. Esto reveló que considerar cuidadosamente la calidad y cobertura de los datos es esencial en estudios filogenómicos.
El Papel de las Métricas de Distancia en el Análisis
Diferentes métricas de distancia pueden influir en la efectividad de métodos como METAL. Los investigadores suelen encontrar que usar distancias corregidas conduce a estimaciones más precisas. Las distancias logdet surgieron como una opción particularmente confiable en muchos análisis. Sin embargo, era importante asegurar que las distancias reflejaran con precisión las relaciones evolutivas que se estaban estudiando.
Usando varios métodos de cálculo de distancia, los investigadores compararon el rendimiento de análisis basados en distancia, encontrando que algunos funcionaban mejor con tipos específicos de datos genéticos. Esto subrayó la necesidad de una selección cuidadosa tanto de estimadores de distancia como de métodos analíticos para mejorar la efectividad de los estudios filogenómicos.
Conclusión
El campo de la filogenómica ha hecho grandes avances en entender las relaciones evolutivas entre especies a través del uso de grandes conjuntos de datos genómicos. A pesar de muchos avances, siguen existiendo desafíos, particularmente con árboles genéticos conflictivos, datos faltantes y la selección de métodos analíticos apropiados.
La investigación continua y los esfuerzos por refinar estos métodos son esenciales para avanzar en nuestra comprensión de las complejas relaciones entre las especies. Al mejorar la calidad de los datos, utilizar técnicas analíticas más sofisticadas y abordar cuidadosamente los desafíos que presentan los datos faltantes, los estudios filogenómicos pueden llevar a representaciones más precisas de la historia evolutiva de la vida en la Tierra.
Título: Testing the mettle of METAL: A comparison of phylogenomic methods using a challenging but well-resolved phylogeny
Resumen: The evolutionary histories of different genomic regions typically differ from each other and from the underlying species phylogeny. This makes species tree estimation challenging. Here, we examine the performance of phylogenomic methods using a well-resolved phylogeny that nevertheless contains many difficult nodes, the species tree of living birds. We compared trees generated by maximum likelihood (ML) analysis of concatenated data, gene tree summary methods, and SVDquartets. We also conduct the first empirical test of a "new" method called METAL (Metric algorithm for Estimation of Trees based on Aggregation of Loci), which is based on evolutionary distances calculated using concatenated data. We conducted this test using a novel dataset comprising more than 4,000 ultraconserved element (UCE) loci from almost all bird families and two existing UCE and intron datasets sampled from almost all avian orders. We identified "reliable clades" very likely to be present in the true avian species tree and used them to assess method performance. ML analyses of concatenated data recovered almost all reliable clades with less data and greater robustness to missing data than other methods. METAL recovered many reliable clades, but only performed well with the largest datasets. Gene tree summary methods (weighted ASTRAL and weighted ASTRID) performed well; they required less data than METAL but more data than ML concatenation. SVDquartets exhibited the worst performance of the methods tested. In addition to the methodological insights, this study provides a novel estimate of avian phylogeny with almost 99% of the currently recognized avian families. Only one of the 181 reliable clades we examined was consistently resolved differently by ML concatenation versus other methods, suggesting that it may be possible to achieve consensus on the deep phylogeny of extant birds.
Autores: Edward L. Braun, C. H. Oliveros, N. D. White Carreiro, M. Zhao, T. C. Glenn, R. T. Brumfield, R. T. Kimball, B. C. Faircloth
Última actualización: 2024-03-22 00:00:00
Idioma: English
Fuente URL: https://www.biorxiv.org/content/10.1101/2024.02.28.582627
Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.02.28.582627.full.pdf
Licencia: https://creativecommons.org/licenses/by-nc/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.