Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物情報学

リンクテージ: 遺伝子調節分析のツール

リンケージは、クロマチンと遺伝子発現データを統合することで、遺伝子調節の研究を簡素化する。

― 1 分で読む


リンケージ変換遺伝子解析リンケージ変換遺伝子解析遺伝子調節の洞察に役立つ強力なツール。
目次

新しいDNA配列解析技術の発展によって、科学者たちは遺伝子調節において重要な役割を果たす非コーディング領域についてもっと学んでいるんだ。これらの非コーディング領域には、転写因子と呼ばれるタンパク質が結合できるスポットを含む、遺伝子を制御するための要素がたくさんある。これらの領域がどのように遺伝子と相互作用するかを理解することは、生物学的プロセスや病気の研究にとって重要なんだ。

クロマチンアクセス性

この分野の重要な概念の一つがクロマチンアクセス性だよ。この用語は、特定のDNA部分に結合する必要があるタンパク質がどれだけアクセスしやすいかを指している。DNAの部分が開いてアクセス可能だと、タンパク質は簡単に付着できて、遺伝子の活性に影響を与える。科学者たちはATAC-seqのような技術を使って、全ゲノムにわたる開いた領域を地図化するんだ。

RNAシーケンシング

もう一つの一般的な技術はRNAシーケンシング(RNA-seq)だ。この方法は遺伝子の発現レベルを測定して、サンプル内でどのくらいの遺伝子が活性化しているかを示す。RNA-seqは病気の理解、がんのタイプ分類、病状の診断、最適な治療法の発見に重要な役割を果たしているよ。

データ統合

研究者たちは、クロマチンアクセス性(ATAC-seqから得たデータ)と遺伝子発現(RNA-seqから得たデータ)を統合して、遺伝子がどのように調節されているかをよりよく理解することを始めている。ただ、この作業は難しいこともあって、複雑なデータセットを分析するのに不慣れな人には特に難しい。でも、ほとんどの利用可能なツールは主に公的データセットを分析するためのもので、個々の研究ニーズには必ずしも合わないんだ。

Linkageアプリケーション

この課題に対処するために、Linkageという新しいユーザーフレンドリーなアプリが開発されたよ。このオンラインツールは、ATAC-seqとRNA-seqからのデータを統合して、潜在的な遺伝子調節要素を調べたり可視化したりできる。Linkageでは、自分のデータをアップロードしたり、公にアクセスできるデータセットを再分析して、ゲノム全体の調節要素を特定することができるんだ。

Linkageの主な機能

ホームモジュール

Linkageのホームモジュールは、紹介として機能し、ユーザーが自分のデータを簡単にインポートできるインターフェースを提供している。乳がんに関連するデータセットと、マウス筋肉幹細胞に関するデータセットの2つの公的データセットの分析を提供している。ユーザーは特定の形式で自分のデータファイルもアップロードできるから、いろんな研究シナリオに対応できるんだ。

調節ピーク検索モジュール

調節ピーク検索モジュールはLinkageの主な機能だよ。特定の遺伝子に関連するすべての可能な調節DNA領域を見つけるのを助けてくれる。このモジュールは、サンプル間でクロマチンアクセス性と遺伝子発現を相関させるための統計分析を自動的に行う。ユーザーは興味のある領域や相関方法を選択して、分析をカスタマイズできるんだ。結果は、DNAアクセス性と遺伝子活性の関係を示す散布図で視覚化できる。

調節ピーク可視化モジュール

潜在的な調節ピークが特定されたら、ユーザーはATAC-seqリードがこれらの領域をどのようにカバーしているか、そしてそれが遺伝子発現にどのように関連しているかを視覚化できる。Linkageは、クロマチンアクセス性レベルに基づいてサンプルをグループ化し、各グループでのターゲット遺伝子の発現レベルを示すボックスプロットと一緒にATAC-seqリードのカバレッジを調べることができるんだ。

調節ピークアノテーションモジュール

次のステップは、予測された調節ピークをアノテーションすることだよ。ユーザーはこれらのピークの特徴を視覚化して、遺伝子に対する位置を確認できる。このモジュールは、ピークが転写開始部位や遺伝子エクソンのような重要なゲノム領域内にあるかどうかについての洞察を提供する。アップセットプロットという視覚化を使って、これらの調節ピークの重複や分布を理解する手助けをするんだ。

シス調節要素検出モジュール

シス調節要素検出モジュールは、遺伝子調節に影響を与える特定のDNA要素を特定するためのものだよ。調節ピーク内の転写因子結合部位(TFBS)を調べることで、これらの因子がDNAとどこで相互作用する可能性があるかを見ることができる。ツールは、強化されたTFBSの位置情報と結合スコアを提供して、シーケンスロゴを使ってデータを視覚化する。

遺伝子調節ネットワークモジュール

異なる調節要素と遺伝子がどのように相互作用するかを理解するのは重要だよ。遺伝子調節ネットワークモジュールを使うと、ユーザーはこの相互作用を示す視覚ネットワークを作成できる。ユーザーは遺伝子リストを入力して、ネットワーク作成のさまざまなパラメータを調整できる。このモジュールは、前の分析を利用して情報に富んだインタラクティブなネットワークを構築し、後で使えるようにカスタマイズして保存できる。

パスウェイエンリッチメント分析モジュール

パスウェイエンリッチメント分析モジュールは、特定された遺伝子を生物学的経路に結びつけるのを助ける。ユーザーは遺伝子リストを入力して、それが分子経路や機能カテゴリ(遺伝子オントロジー(GO)や京都遺伝子ゲノム百科事典(KEGG)など)とどう関係しているかを見ることができる。この分析は、さまざまな生物学的コンテキストでの遺伝子の基本的な機能や役割を明らかにすることができるんだ。

ケーススタディ

Linkageの使い方を示すために、乳がんとマウス筋肉幹細胞に関するケーススタディを考えてみよう。研究者たちは、クロマチンアクセス性と遺伝子発現に関するデータが一致したサンプルを両グループから収集したよ。Linkageを使って、どの調節領域が乳がんの遺伝子発現に影響を与えるかを分析したんだ。

この分析は数千の発現遺伝子をカバーし、厳格な基準を使って、研究者たちはこれらの遺伝子に関連する多くの調節領域を特定した。マウスのサンプルでの同様の分析では、数百の遺伝子に対する調節領域のリストが得られたんだ。これらの発見は、Linkageが複雑なデータから遺伝子調節要素を効果的に明らかにすることができることを強調しているよ。

結論

Linkageは、大規模なマルチオミクスデータを分析しようとしている研究者向けに設計された多目的なウェブベースアプリケーションなんだ。クロマチンアクセス性と遺伝子発現データを統合することで、ゲノム全体のDNA調節要素を簡単に特定できるようにしている。アプリケーションは、視覚化、アノテーション、ネットワーク分析のためのユーザーフレンドリーなツールを提供していて、バイオインフォマティクスのバックグラウンドが限られている人でもアクセスできるようになっているよ。もっと経験のある人には、分析プロセスを強化するためにカスタマイズ可能なパラメータも用意されている。シーケンシング技術の進展と、統合的なマルチオミクス分析への関心が高まっている中で、Linkageのようなツールは、複雑な生物学的システムを研究する研究者にとって重要になるだろう。Linkageの開発は、遺伝子調節や健康、病気の影響を理解するために研究コミュニティを支えることを約束してるんだ。

オリジナルソース

タイトル: Linkage: an interactive shiny app and R package for linking of DNA regulatory peaks to genes

概要: SummaryExisting studies have demonstrated that the integration analysis of transcriptomic and epigenomic data can be used to better understand the onset and progression of many diseases, as well as identify new diagnostic and prognostic biomarkers. However, such investigations on large-scale sequencing data remain challenging for researchers or clinicians with limited bioinformatics knowledge. To facilitate the interpretation of gene regulatory landscape, we developed an R Shiny application and R package [Linking of atac-seq to gene expression data (Linkage)] for exploring and visualizing potential cis-regulatory elements (CREs) of genes based on ATAC-seq and RNA-seq data. Linkage offers six modules to systematically identify, annotate, and interpret potential gene regulatory elements from the whole genome step by step. Linkage can provide interactive visualization for the correlation between chromatin accessibility and gene expression. More than that, Linkage identifies transcription factors (TFs) that potentially drive the chromatin changes through identifying TF binding motifs within the CREs and constructing trans-regulatory networks of the target gene set. This powerful tool enables researchers to conduct extensive multiomics integration analysis and generate visually appealing visualizations that effectively highlight the relationship between genes and corresponding regulatory elements. With Linkage, users can obtain publishable results and gain deeper insights into the gene regulatory landscape. Availability and implementation Linkage is freely available as a Shiny web application (https://xulabgdpu.org.cn/linkage) and an R package (https://github.com/XuLab-GDPU/Linkage). The documentation is available at (https://aicplane.github.io/Linkage-tutorial/).

著者: Siwen Xu, Z. Liu, S. Chen, T. Li, C. Zhang, Y. Luo, J. Zheng, Z. Lu, J. Yang

最終更新: 2024-04-28 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.04.24.590756

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.04.24.590756.full.pdf

ライセンス: https://creativecommons.org/licenses/by-nc/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事