Simple Science

Scienza all'avanguardia spiegata semplicemente

# La biologia# Biologia evolutiva

Le percentuali di ricombinazione influenzano le intuizioni sulla storia della popolazione

Alti tassi di ricombinazione mettono alla prova la nostra comprensione della genetica delle popolazioni.

― 7 leggere min


I tassi di ricombinazioneI tassi di ricombinazioneinfluenzano le intuizionigenetiche.genetica.inferenze demografiche nella ricercaL'alta ricombinazione complica le
Indice

Lo studio delle variazioni genetiche nelle popolazioni rivela molto sulla loro storia e evoluzione. Gli scienziati sono riusciti a capire come le diverse specie siano cambiate nel tempo analizzando i loro dati genetici. Con più dati sul genoma disponibili, i ricercatori hanno creato vari modi per analizzare queste informazioni per comprendere i movimenti, i cambiamenti e le dinamiche delle popolazioni.

Questi metodi vengono spesso usati prima sugli esseri umani per capire la nostra storia demografica. Una volta convalidati, vengono applicati ad animali e piante, aiutandoci a imparare di più sulla loro evoluzione e sostenendo gli sforzi di conservazione. Tuttavia, l'efficacia di questi metodi sulle specie non umane non è stata testata a fondo.

Grafo di Ricombinazione Ancestrale

Un approccio popolare per tracciare la storia delle popolazioni è il grafo di ricombinazione ancestrale (ARG). Questo grafo illustra la storia del materiale genetico trasferito attraverso le generazioni. Mostra come diverse sequenze di DNA siano correlate e può fornire spunti su eventi come le Mutazioni, che sono cambiamenti nella sequenza del DNA.

L'ARG cattura molte informazioni sulla storia di una popolazione. Studiando questi grafi, gli scienziati possono ottenere informazioni su eventi che hanno plasmato la struttura genetica di una popolazione nel tempo. Tuttavia, affinché questo metodo funzioni, i ricercatori devono inferire con precisione l'ARG dai dati genetici. Questa inferenza si basa sulla presenza di mutazioni, che indicano dove sono avvenuti cambiamenti nelle sequenze di DNA. Il tasso al quale si verificano le mutazioni rispetto al tasso di ricombinazione può influenzare significativamente quanto bene gli scienziati possano ricostruire l'ARG.

Tassi di Ricombinazione e Mutazione

La ricombinazione è un processo naturale durante il quale il materiale genetico viene mescolato durante la riproduzione. Se la ricombinazione si verifica frequentemente rispetto alle mutazioni, può complicare la capacità di identificare accuratamente alcuni rami nell'ARG.

Negli esseri umani e in alcune altre specie, i tassi di ricombinazione sono generalmente bassi, permettendo di ottenere intuizioni più chiare sulla loro storia genetica. Tuttavia, non è così per tutte le specie, specialmente quelle senza certi fattori genetici che influenzano la ricombinazione. Nelle specie con alti tassi di ricombinazione, l'ARG potrebbe non riflettere accuratamente la storia reale perché molti rami potrebbero mancare.

Indagare l'Impatto della Ricombinazione

In questo studio, i ricercatori miravano a capire come i tassi variabili di ricombinazione influenzino l'accuratezza delle inferenze demografiche quando si utilizzano metodi basati sull'ARG. Hanno condotto simulazioni per mimare diverse storie di popolazioni e schemi di ricombinazione, testando questi metodi in vari scenari.

I ricercatori si sono concentrati su due metodi, MSMC2 e Relate, che differiscono nel modo in cui modellano l'ARG. MSMC2 guarda ai tempi di coalescenza, che sono punti nel passato in cui due sequenze condividono un antenato comune. Invece, Relate inferisce una serie di genealogie attraverso il genoma.

Per valutare l'impatto degli alti tassi di ricombinazione, hanno simulato genomi con vari paesaggi di ricombinazione e tracciato quanto bene questi metodi potessero inferire le dimensioni storiche delle popolazioni e gli eventi di divisione in diverse condizioni.

Progettazione dello Studio di Simulazione

Le simulazioni hanno coinvolto tre popolazioni che si sono divise da un antenato comune in un punto scelto nella storia. Ogni popolazione ha seguito una traiettoria diversa riguardo alla sua dimensione: una è rimasta costante, un'altra è aumentata e l'ultima è diminuita nel tempo. Per esaminare l'impatto dei tassi di ricombinazione, i ricercatori hanno creato diverse mappe genetiche, alterando il tasso di ricombinazione in diverse regioni del cromosoma.

Lo studio ha esaminato in particolare se mascherare le regioni ad alta ricombinazione migliorasse l'accuratezza delle inferenze demografiche. Questo mascheramento comportava la nascita di certe porzioni del genoma che erano identificate come ad alta ricombinazione. Confrontando i risultati con e senza queste regioni mascherate, i ricercatori speravano di evidenziare gli effetti della ricombinazione sull'inferenza.

Risultati sulle Inferenze sulla Dimensione della Popolazione Efficace

I risultati iniziali hanno mostrato che quando le regioni ad alta ricombinazione non erano mascherate, il metodo MSMC2 produceva stime molto rumorose, specialmente per le storie recenti. Anche quando i tassi di ricombinazione erano inferiori ai tassi di mutazione, ottenere stime accurate per il passato recente era difficile. Man mano che il tasso medio di ricombinazione aumentava rispetto ai tassi di mutazione, le Dimensioni della popolazione inferite cominciavano a deviare significativamente dai valori attesi.

Al contrario, il metodo Relate, che utilizzava più punti dati attraverso i haplotipi, si comportava meglio anche quando le regioni ad alta ricombinazione erano incluse. Anche se mostrava ancora un certo livello di sottovalutazione per alcune dimensioni di popolazione, era meno influenzato nel complesso rispetto a MSMC2.

I risultati hanno indicato che quando le regioni ad alta ricombinazione venivano rimosse dalla considerazione, sia MSMC2 che Relate producevano inferenze demografiche più accurate. I risultati suggerivano che gli errori localizzati all'interno delle aree ad alta ricombinazione avevano un effetto significativo sulle inferenze fatte da questi metodi.

Inferenze sugli Eventi di Divisione della Popolazione

Lo studio ha esaminato anche come la ricombinazione influenzasse l'inferenza delle divisioni storiche delle popolazioni. Il tasso di coalescenza relativo (rCCR) è stato utilizzato per misurare il timing e l'occorrenza degli eventi di divisione tra le popolazioni. Sia per MSMC2 che per Relate, la presenza di regioni ad alta ricombinazione distorceva il timing delle divisioni inferite.

In particolare, MSMC2 indicava divisioni di popolazione che si verificavano prima degli eventi reali, specialmente quando si trattava di popolazioni che avevano subito cambiamenti significativi nelle dimensioni. D'altra parte, Relate produceva stime che si allineavano strettamente con i veri tempi di divisione quando le regioni ad alta ricombinazione erano mascherate.

Questi risultati hanno rinforzato l'idea che le regioni ad alta ricombinazione possano portare a bias nelle argomentazioni sulla storia delle popolazioni, influenzando quanto accuratamente i ricercatori possano rintracciare le divisioni delle popolazioni.

Valutare gli Effetti delle Nette Aree ad Alta Ricombinazione

Per approfondire ulteriormente i diversi tassi di ricombinazione, i ricercatori hanno testato scenari aggiuntivi che coinvolgevano aree ad alta ricombinazione strette anziché larghe. Attraverso queste simulazioni, hanno scoperto che, mentre sia MSMC2 che Relate mostravano sensibilità ai tassi di ricombinazione elevati, reagivano in modo diverso a seconda della configurazione del paesaggio di ricombinazione.

Per gli scenari con regioni ad alta ricombinazione strette, MSMC2 ha faticato di più rispetto a Relate, che ha mantenuto le sue prestazioni nonostante le condizioni difficili. Questa distinzione è diventata cruciale per comprendere la robustezza dei diversi metodi quando affrontano paesaggi ad alta ricombinazione.

Applicazione ai Dati del Mondo Reale

Per collegare i loro risultati a implicazioni reali, i ricercatori hanno applicato i loro metodi a dati reali raccolti dal cappuccino eurasiatico, una specie di uccello canoro. Il cappuccino è interessante da studiare perché, a differenza degli esseri umani, manca di certi fattori genetici che dettano il paesaggio di ricombinazione, portando a regioni più ampie di alta ricombinazione.

Analizzando i genomi di molti individui di cappuccino, i ricercatori hanno separato i dati genomici in regioni a bassa e alta ricombinazione e hanno svolto inferenze demografiche. I risultati di MSMC2 riflettevano i modelli osservati nelle loro simulazioni, mostrando differenze significative nelle dimensioni stimate della popolazione e nel timing delle divisioni basate sul paesaggio di ricombinazione.

Al contrario, Relate ha dimostrato robustezza, fornendo inferenze coerenti indipendentemente dai tassi di ricombinazione presenti nei dati. Questa disparità nelle prestazioni rispecchiava i risultati delle simulazioni, indicando chiare applicazioni pratiche dei loro risultati.

Importanza della Cautela con i Metodi Basati sull'ARG

Lo studio sottolinea la necessità di cautela quando si applicano metodi basati sull'ARG a specie con schemi di ricombinazione distinti da quelli degli esseri umani. Poiché molte specie presentano paesaggi di ricombinazione più ampi, i ricercatori devono essere consapevoli di come i tassi elevati di ricombinazione possano distorcere le inferenze demografiche.

Le sfide nel definire quali regioni mascherare a causa della variabilità nei tassi di ricombinazione tra diverse specie e cromosomi pongono anche ostacoli pratici. Anche se il mascheramento può migliorare l'accuratezza, determinare quali regioni includere o escludere non è semplice.

Conclusione

In sintesi, questo studio illustra che il paesaggio della ricombinazione può influenzare significativamente la nostra comprensione della genomica delle popolazioni. Dimostrando come i tassi elevati di ricombinazione impattino sull'inferenza della storia demografica e delle divisioni delle popolazioni, i risultati evidenziano considerazioni essenziali per i ricercatori che lavorano con specie non umane. Un'esplorazione continua di queste dinamiche sarà vitale per garantire che i metodi utilizzati nella genomica delle popolazioni siano applicati in modo accurato ed efficace su varie specie.

Fonte originale

Titolo: High-recombining genomic regions affect demography inference

Estratto: Inference of population history of non-model species is important in evolutionary and conser- vation biology. Multiple methods of population genomics, including those to infer population history, are based on the ancestral recombination graph (ARG). These methods use observed mutations to model local genealogies changing along chromosomes. Breakpoints at which genealogies change effectively represent the positions of historical recombination events. How- ever, inference of underlying genealogies is difficult in regions with high recombination rate relative to mutation rate. This is because genealogies cover genomic intervals that are too short to accommodate sufficiently many mutations informative of the structure of the un- derlying genealogies. Despite the prevalence of high-recombining genomic regions in some non-model organisms, such as birds, its effect on ARG-based demography inference has not been well studied. Here, we use population genomics simulations to investigate the impact of high-recombining regions on ARG-based demography inference. We demonstrate that inference of effective population size and the time of population split events is systematically affected when high-recombining regions cover wide breadths of the chromosomes. We also show that excluding high-recombining genomic regions can practically mitigate this effect. Finally, we confirm the relevance of our findings in empirical analysis by contrasting demography inferences applied for a bird species, the Eurasian blackcap (Sylvia atricapilla), using different parts of the genome with high and low recombination rates. Our results suggest that demography inference using ARG-based methods should be carried out with caution when applied in species whose reference genomes contain long stretches of high-recombining regions.

Autori: Jun Ishigohoka, M. Liedvogel

Ultimo aggiornamento: 2024-02-08 00:00:00

Lingua: English

URL di origine: https://www.biorxiv.org/content/10.1101/2024.02.05.579015

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.02.05.579015.full.pdf

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili