Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物情報学

肝炎B RNAを研究する新しいツール

ボレロはHBV RNAの定量化を助け、感染に関する洞察を明らかにする。

― 1 分で読む


ボレロ: HBVボレロ: HBVRNAの分析RNA定量のための新しい効果的な方法。HBV
目次

世界中で約2億9000万人がB型肝炎ウイルス(HBV)の慢性感染にかかってるんだ。これが深刻な肝臓の問題、例えば肝硬変や肝臓がんを引き起こすこともあるんだって。1981年からHBV感染やその広がりを防ぐワクチンがあるけど、今の治療法では大半の患者を治すことはできないんだ。HBVが肝臓のDNAの中に隠れる能力、いわゆる共価的閉鎖環状DNA(cccDNA)の形で隠れるのが大きな理由の一つだよ。だから、cccDNAの活動を減らす新しい治療法を見つけることがすごく重要なんだ。

この新しい治療法を開発するには、肝臓にどれだけHBVがいるのかを示す良いマーカーが必要なんだ。最近の研究によると、血液中のHBV RNAを測定することでcccDNAの活動を示す有用な方法になるかもしれないんだ。でも、このRNA分子を研究するのはHBVの独特な構造のために難しいんだ。

HBVとそのRNAの理解

HBVは約3.2キロベースの小さな円形のDNAを持ってて、これが8つの主なタイプのRNA分子を生成することができるんだ:preCore, pgRNA, preS1, preS2, HBs, L-HBx, M-HBx、そしてS-HBxだよ。最も長いRNAタイプであるpgRNAとpreCoreは、実はウイルスのDNA自体よりも長いんだ。このRNAにはRNAポリメラーゼIIという酵素によって作られたため、端に余分な部分があるんだ。さらに、小さなHBV RNAはその配列が重なっていることがあって、個別に研究するのが難しいんだ。

研究者たちは、これらのRNAタイプの22のスプライスバリアント、すなわちSP01からSP22までを特定したんだ。一部のスプライスバリアントはpgRNAから来ていて、他はpreS2/HBs RNAから派生しているんだ。スプライスバリアントは主なHBV RNAと多くの類似点を持っているから、どれがどれかを見分けるには、新しいRNAを作り始める位置とつながる位置を知る必要があるんだ。

HBV RNAを捕まえる新しい方法

最近、5'ラピッド増幅法(5’RACE)という方法が開発されたんだ。この技術は、完全長のHBV RNAをキャッチするのに役立つんだ。特別なプライマーを使ってRNAの始まりにくっつけて、これらの分子を分離して、コピーを作るんだ。Oxford Nanopore Technology(ONT)という長鎖シーケンシング技術と組み合わせることで、HBV RNA分子の完全長の配列を読むことができるんだ。

でも、このシーケンシングによって得られたデータを分析するには、広く利用可能じゃない特定のツールが必要なんだ。そのニーズに応えるために、Boleroという新しいツールが作られたんだ。Boleroは、異なるHBV RNAとそのスプライスバリアントのレベルを評価するために設計されているんだ。このツールは、HBV転写物の構造と似たような重複部分で知られる音楽の一部にちなんで名付けられたんだ。Boleroを使えば、研究者はサンプル中の異なるHBV RNAタイプの量を特定して、新しいスプライスバリアントを見つけることができるかもしれないんだ。

Boleroのワークフロー

Boleroシステムは、RNAシーケンシングデータを処理する一連のステップとして機能するんだ。最初に、ONT生成の生データファイルや前処理されたファイルを扱うことができるんだ。Boleroのワークフローには、質の低いリードをフィルタリングしたり、RNA配列をリファレンスゲノムにアラインしたり、異なるHBV RNAタイプの開始位置を特定したりするいくつかの重要なステージが含まれているんだ。

合成データセットを使用した場合、Boleroはリードを正確にフィルタリングしてマッピングする素晴らしい結果を示したんだ。これは、研究者がこのツールによって生成されたデータを信頼してHBV RNAレベルの明確な状況を得られることを意味してるんだ。

ワークフローでのフィルタリングステップ

質の高いデータだけが使用されるようにするために、Boleroはフィルタリングステップを含んでるんだ。最初に、HBV RNAに期待される特定の配列の存在をチェックするんだ。これにより、完全なHBV RNAを表さないリードを取り除く手助けをするんだ。シミュレーションでは、合成リードのごく一部だけがこれらのフィルタリングステップを通過したことが示されてて、このプロセスの重要性を示しているんだ。

データがフィルタリングされたら、それをHBV RNAのリファレンス配列にマッピングするんだ。HBVゲノムが円形で、最も長いRNA分子が実際のウイルスDNAよりも長いため、リファレンス配列は慎重に選ぶ必要があるんだ。preCore RNAはすべての既知のHBV RNAタイプを含んでいるから、アライメントのリファレンスとして機能するんだ。Boleroは、スプライシングイベントを認識してRNAタイプを正確に特定できるMinimap2というアライメントツールを使用するんだ。

HBV RNAの開始位置を特定する

HBV RNAの各タイプには、特定の開始位置があって、これが異なるRNAタイプを分類して理解するのに重要なんだ。データセットを分析することで、研究者は各RNAタイプの開始座標を特定できるんだ。ただ、preS2やHBsのような一部のRNAは開始位置が重なっていることがあって、見分けるのが難しくなるんだ。

これに対処するために、Boleroは特定の開始位置の範囲内にあるリードをグループ化するんだ。これにより、幅広い分類が可能になるが、RNAタイプの理解がはっきりするんだ。この情報を組み合わせることで、研究者はサンプル中の各HBV RNAがどれだけ存在するかを見ることができるんだ。

スプライスバリアントとその特定

主なHBV RNAに加えて、研究者が追跡したいスプライスバリアントも存在するんだ。これらのバリアントは親RNAタイプとは異なる特性を持っているんだ。Boleroは、Nanosplicerというソフトウェアツールを使ってリード内のスプライス接合部を特定できるんだ。これは、スプライス接合部を含むリードが特定のスプライスバリアントに割り当てられ、他のリードは主なRNAタイプの下に分類され続けることを意味するんだ。

スプライシングを理解することは、HBV RNAの全体像を把握するために重要なんだ。特定のスプライスバリアントは他のものよりも豊富で、これらのバリアントを知ることはHBV感染やその影響を研究するのに役立つんだ。

実際のサンプルでのBoleroの検証

シミュレートデータでのテストが成功した後、BoleroはHBVに感染した細胞から採取した実際のサンプルにも適用されたんだ。結果は、Boleroが生物学的サンプルからHBV RNAを効果的に分析して定量化できることを示したんだ。具体的には、異なるHBV RNA種が複数のサンプルで一貫した量で存在していることが分かったんだ。これは、この方法が実際の感染におけるHBV RNAタイプを特定して測定するのに信頼できることを示してるんだ。

HBV RNAの分析における課題

HBV RNAを研究するのは、ウイルスのゲノムの複雑な構造のために難しい場合があるんだ。すべてのHBV RNAタイプには共通の特徴があって、研究者は特定の転写物を識別する際によく問題に直面するんだ。従来の定量PCRのような方法は、重複するRNAタイプを区別するのに苦労しているから、効果的ではないんだ。

この課題に対処するために、研究者は長鎖シーケンシング技術にますます注目しているんだ。これらは、さまざまなRNA分子を正確にキャッチして特定する能力があって、HBVトランスクリプトームのより包括的な視野を提供できるんだ。

他の研究との比較

他の研究では、異なる方法や技術を使ってHBV RNAを調べているんだ。例えば、患者の全RNAサンプルからHBV RNAを濃縮する技術を使った研究者もいるし、患者の血清中でHBV RNAを検出したけど、正確に定量化するのに苦労した研究者もいるんだ。これらの方法論の違いが、似たようなHBV RNAタイプを調べていても異なる結果につながることがあるんだ。

Boleroの方法は、合成データセットを使用してその効果を検証することで際立っているんだ。生物サンプルに適用する前に、その効果を確かめるためのデータを得られるのがいいところなんだ。また、HBV RNAの全範囲とそのレベルを理解するのにも優れた利点を提供するんだ。

結論

Boleroは、HBV RNA種を特定し、定量化するための革新的なツールなんだ。さまざまな先進技術を統合して、そのデータを包括的に分析することで、BoleroはHBVや感染した個体でのその挙動の理解を深める助けをしてくれるんだ。この知識は、効果的な治療法を開発し、この持続的なウイルス感染の複雑さを理解するために重要なんだ。

オリジナルソース

タイトル: Bolero: a dedicated workflow to decipher Hepatitis B virus transcriptome from long-reads sequencing method coupled to 5RACE amplification of transcripts

概要: Hepatitis B virus (HBV) represents a major health burden, as it affects close to 290 million people worldwide. Although prophylactic vaccines are available, current therapeutic compounds do not usually achieve HBV eradication due to the persistence of the covalently closed circular (ccc)DNA that serves as viral reservoir. Thus, novel biomarkers that reliably reflect intrahepatic cccDNA transcriptional activity would be highly relevant for the monitoring of infected individuals, as well as the evaluation of new treatments targeting HBV. In this context, the development of 5 rapid amplification of complementary DNA ends (5RACE) as a strategy to capture and amplify full-length HBV RNAs, coupled with long-read and full-length sequencing approaches (e.g., Oxford Nanopore Technology), has recently enabled the detailed characterization of these molecules. The analysis of such data requires a dedicated bioinformatics pipeline due to the highly condensed nature of the HBV genome, which is characterized by the production of multiple transcripts and spliced variants that overlap each other. Here, we present Bolero, a computational method and built-in workflow designed to handle HBV sequencing data and evaluate the relative expression of viral RNAs and their spliced variants. The analysis of HBV-infected cell lines demonstrates that our bioinformatics pipeline is efficient for the identification and quantification of individual HBV mRNAs. Thus, Bolero represents a useful tool to study cccDNA transcriptional activity and the heterogeneity of HBV RNA spliced variants. Author summaryTranscriptomic analyses have brought comprehensive insights in the mechanisms controlling gene expression. Moreover, with the recent advances in sequencing technologies and computational methods, researchers can nowadays not only quantify gene expression, but also study alternative splicing, polyadenylation, transcription initiation, and even rare phenomena such as distant gene fusions. However, conventional analysis tools still rely heavily on the assumption of linear genomes with minimal overlap between open reading frames, rendering them insufficient for studying complex viruses such as hepatitis B virus (HBV). Unlike typical linear genomes, HBV genome consists in a circular DNA molecule, which results in an extensive sequence overlap between its transcripts. To tackle these challenges, we developed an innovative approach coupling 5 rapid amplification of complementary DNA ends (5RACE) and long-read sequencing to comprehensively explore the HBV transcriptome. Furthermore, we developed Bolero, a computational method designed to handle the peculiarities of HBV sequencing data, which allows a detailed characterization of the HBV transcriptome.

著者: Xavier Grand, G. Giraud, A. Rifki, A. Paturel, D. Bousquet, A. A. Roca Suarez, C. Bourgeois, M. Levrero, F. Zoulim, B. Testoni

最終更新: 2024-09-21 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.09.17.613398

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.09.17.613398.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事