再結合率が人口史への洞察に影響を与える
高い再結合率は、集団遺伝学への理解を難しくしてる。
― 1 分で読む
目次
遺伝的変異の研究は、集団の歴史や進化についてたくさんのことを明らかにするんだ。科学者たちは、遺伝子データを見て、異なる種がどのように時間をかけて変化してきたかを学んできたんだ。もっとゲノムデータが手に入るようになって、研究者たちはこのデータを分析するためのいろんな方法を作って、集団の移動や変化、ダイナミクスを理解しようとしているよ。
これらの方法は、まず人間に使われて、私たちの集団の歴史を把握するために使われる。検証されたら、動物や植物にも適用されて、その進化についてもっと学び、保全活動にも役立てられているんだ。でも、非人間種に使ったときの効果は十分にテストされていないんだ。
祖先再結合グラフ
集団の歴史を追跡するための人気のあるアプローチは、祖先再結合グラフ(ARG)を使うことなんだ。このグラフは、世代を通じて遺伝物質がどのように移り変わってきたかを示している。異なるDNAの配列がどのように関連しているかを示して、変異のような出来事、つまりDNA配列の変化についての洞察を提供してくれるよ。
ARGは、集団の歴史についてたくさんの情報をキャッチできる。これらのグラフを研究することによって、科学者たちは集団の遺伝的構造を形作った出来事についての洞察を得ることができるんだ。でも、この方法が機能するためには、研究者が遺伝子データからARGを正確に推測する必要がある。推測は変異の存在に依存していて、どこでDNAの配列が変わったかを示しているんだ。変異が起こる頻度と再結合が起こる頻度の比率が、科学者たちがARGを再構築する能力に大きな影響を与えるんだ。
再結合と変異の率
再結合は、繁殖の際に遺伝物質が混ざる自然なプロセスなんだ。もし再結合が変異と比べて頻繁に起こると、ARGの特定の枝を正確に特定する能力が複雑になることがあるよ。
人間や他のいくつかの種では、再結合率が一般的に低いから、遺伝的歴史についての明確な洞察を得やすいんだ。でも、これはすべての種には当てはまらなくて、再結合に影響を与える遺伝的要素を持たない種もあるんだ。再結合率が高い種では、ARGが実際の歴史を正確に反映しないことがあるのは、たくさんの枝が欠けているからだよ。
再結合の影響を調査する
この研究では、研究者は異なる再結合率がARGベースの方法を使ったときの人口推測の精度にどう影響するかを理解しようとしたんだ。さまざまな人口の歴史や再結合パターンを模倣するシミュレーションを行い、さまざまなシナリオの下でこれらの方法をテストしたんだ。
研究者たちは、ARGをモデル化する方法が異なる2つの方法、MSMC2とRelateに焦点を当てたよ。MSMC2は、共通の祖先を持つ2つの配列が共有していた過去の時点である共通祖先の時間を見ている。一方、Relateは、ゲノム全体にわたる系譜の一連を推測するんだ。
高い再結合率の影響を評価するために、彼らはさまざまな再結合の風景を持つゲノムをシミュレーションし、これらの方法が異なる条件下でどれだけ歴史的な人口サイズや分岐イベントを推測できるかを追跡したんだ。
シミュレーション研究の設計
シミュレーションでは、共通の祖先から選んだ歴史のポイントで分かれた3つの集団が関与していた。それぞれの集団は異なるサイズの軌跡をたどった-1つは一定のままで、もう1つは増加し、最後の1つは時間とともに減少したんだ。再結合率の影響を調べるために、研究者たちはいくつかの遺伝マップを作成し、染色体の異なる領域で再結合率を変更したよ。
この研究は特に、高い再結合領域をマスクすることで人口推測の精度が向上するかどうかを調べたんだ。このマスキングでは、高い再結合として特定されたゲノムの特定の部分を隠すことを含んでいたんだ。マスクされたこれらの領域がある場合とない場合の結果を比較することで、研究者たちは再結合が推測に与える影響を浮き彫りにしたかったんだ。
人口サイズの推測に関する発見
最初の結果は、高い再結合領域がマスクされていないとき、MSMC2の方法が特に最近の歴史に対して非常に騒がしい推定を生成したことを示していた。変異率よりも再結合率が低い場合でも、最近の過去の正確な推定を得ることは難しかったんだ。平均再結合率が変異率に対して増加すると、推測された人口サイズが予想値から大きく逸脱し始めたよ。
一方、Relateの方法は、ハプロタイプ全体にわたるもっと多くのデータポイントを利用して、再結合領域が含まれていてもより良いパフォーマンスを示したんだ。特定の人口サイズに対する過小評価が見られたものの、全体的にはMSMC2とは比較にならないほど影響を受けなかったんだ。
結果は、高い再結合領域を考慮から除外すると、MSMC2とRelateの両方がより正確な人口推測を行ったことを示した。発見は、高い再結合領域内の局所的なエラーがこれらの方法による推測に大きな影響を与えたことを示唆しているよ。
人口分岐イベントに関する推測
この研究では、再結合が歴史的な人口分岐の推測にどう影響するかも調べたんだ。相対交差共通祖先率(rCCR)が、集団間の分岐イベントのタイミングや発生を測定するために使われたよ。MSMC2とRelateの両方で、高い再結合領域の存在が分岐のタイミングを歪めてたんだ。
特に、MSMC2は、特にサイズに大きな変化があった集団に対して、実際のイベントよりも早く人口分岐が起こると示したよ。一方、Relateは、高い再結合領域がマスクされたとき、真の分岐時間に非常に近い推定値を生成したんだ。
これらの発見は、高い再結合領域が人口の歴史に関する議論にバイアスをもたらす可能性があり、研究者が人口分岐をどれだけ正確に追跡できるかに影響を与えるという考えを強化したんだ。
狭い高再結合領域の影響を評価する
再結合率の違いを深く探るために、研究者たちは広い高再結合領域ではなく、狭い高再結合領域を含む追加のシナリオをテストしたよ。これらのシミュレーションを通じて、MSMC2とRelateの両方が高い再結合率に敏感であることがわかったけど、再結合の風景の構成によって反応が異なることが分かったんだ。
狭い高再結合領域のシナリオでは、MSMC2がRelateよりも苦労していたけど、Relateは厳しい条件でもパフォーマンスを維持していたんだ。この違いは、高再結合の風景に直面したときの異なる方法の堅牢性を理解するのに重要だったよ。
実データへの適用
研究者たちは、実際のデータに自分たちの方法を適用して、研究結果を現実世界に結びつけようとしたんだ。彼らは、ユーラシアのウグイス、つまり歌鳥の一種から収集した実際のデータを使ったよ。このウグイスは、他の種と違って、再結合の風景を決定する特定の遺伝的要素が欠けているから、高い再結合の広い領域を持っているのが面白いんだ。
多くのウグイス個体のゲノムを分析することで、研究者たちは遺伝子データを低再結合領域と高再結合領域に分けて、人口推測を行ったんだ。MSMC2からの結果は、シミュレーションで観察されたパターンを反映していて、高再結合の風景に基づく人口サイズの推定や分岐のタイミングにおいて顕著な違いを示していたよ。
逆に、Relateは再結合率に関係なく一貫した推測を得られて、堅牢性を示したんだ。このパフォーマンスの違いはシミュレーション結果と一致していて、研究結果の現実世界での適用の明確な指標となったんだ。
ARGベースの方法に対する注意の重要性
この研究は、ARGベースの方法を人間とは異なる再結合パターンを持つ種に適用する際の注意の必要性を強調しているんだ。多くの種がより広い再結合の風景を持っているから、高い再結合率が人口推測を歪める可能性に気をつけなきゃいけないんだ。
異なる種や染色体間で再結合率の変動があるため、どの領域をマスクするかを定義することも実際的な課題を引き起こすし、マスキングが精度を向上させることができる一方で、どの領域を含めるべきか除外するべきかを判断するのは簡単じゃないんだ。
結論
まとめると、この研究は再結合の風景が集団ゲノミクスの理解に大きな影響を与えることを示しているんだ。高い再結合率が人口の歴史や分岐の推測にどう影響するかを示して、非人間種を扱う研究者たちに重要な考慮事項を強調しているよ。これらのダイナミクスを引き続き探求していくことが、さまざまな種にわたって集団ゲノミクスの手法を正確かつ効果的に適用できるようにするために重要なんだ。
タイトル: High-recombining genomic regions affect demography inference
概要: Inference of population history of non-model species is important in evolutionary and conser- vation biology. Multiple methods of population genomics, including those to infer population history, are based on the ancestral recombination graph (ARG). These methods use observed mutations to model local genealogies changing along chromosomes. Breakpoints at which genealogies change effectively represent the positions of historical recombination events. How- ever, inference of underlying genealogies is difficult in regions with high recombination rate relative to mutation rate. This is because genealogies cover genomic intervals that are too short to accommodate sufficiently many mutations informative of the structure of the un- derlying genealogies. Despite the prevalence of high-recombining genomic regions in some non-model organisms, such as birds, its effect on ARG-based demography inference has not been well studied. Here, we use population genomics simulations to investigate the impact of high-recombining regions on ARG-based demography inference. We demonstrate that inference of effective population size and the time of population split events is systematically affected when high-recombining regions cover wide breadths of the chromosomes. We also show that excluding high-recombining genomic regions can practically mitigate this effect. Finally, we confirm the relevance of our findings in empirical analysis by contrasting demography inferences applied for a bird species, the Eurasian blackcap (Sylvia atricapilla), using different parts of the genome with high and low recombination rates. Our results suggest that demography inference using ARG-based methods should be carried out with caution when applied in species whose reference genomes contain long stretches of high-recombining regions.
著者: Jun Ishigohoka, M. Liedvogel
最終更新: 2024-02-08 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.02.05.579015
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.02.05.579015.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。