Simple Science

最先端の科学をわかりやすく解説

# 生物学# ゲノミクス

隠れた遺伝要素に関する新しい洞察

研究がuORFの遺伝子発現とタンパク質機能における潜在的な役割を明らかにした。

― 1 分で読む


uORFs:uORFs:隠れた遺伝子の拡張ないんだ。張してタンパク質の機能を強化するかもしれ研究によると、uORFが既存の遺伝子を拡
目次

最近の研究で、人間には約20,000のタンパク質コーディング遺伝子があることがわかったんだ。でも、まだ完全に特定されていない何千もの小さな遺伝子があるかもしれないんだ。これらの小さな遺伝子、いわゆる上流オープンリーディングフレーム(UORF)は、既存の遺伝子の近くに見つかることが多く、何らかの形でそれらに結びついている可能性があるんだ。今のところ、こうした新しい遺伝子のうち、主要な人間遺伝子データベースで公式に認識されているのはほんの数個だけなんだ。

一つの大きな混乱点は、これらのuORFが具体的に何なのかってこと。完全に新しいタンパク質を示すという考えは、私たちのDNAに珍しい転写物を作ることを意味していて、これはあまり一般的じゃないんだ。公式に文書化されたのは、そんなケースはたったの10例しかないんだ。そこで研究者たちは、これらのuORFが別のタンパク質ではなく、既知の遺伝子の延長なんじゃないかと考えたんだ。そうなると、既存の遺伝子と結びついて、私たちのリストに新しい遺伝子をたくさん追加する必要がなくなるかもしれないんだ。

このアイデアを検証するために、研究者たちはDNAの中でuORFがどのように関連する遺伝子とつながっているかを示す特定の信号を探したんだ。RNAの断片がどのように組み合わされて最終的な機能的な遺伝子を作るのかを示すスプライシングのパターンをチェックしたんだ。以前の研究では、いくつかのuORFが実際にタンパク質をコードする可能性があることが示されたけど、まだ確定的な証拠ではないんだ。

新しいタンパク質コーディング領域の可能性について、研究者たちは各種の研究からリストをまとめ始めたんだ。多くのデータは、タンパク質を構築する役割を持つリボソームを追跡する実験から得られたんだ。多くのuORFは、以前は遺伝子のただの余白だと思われていた場所にあり、しばしばコーディング転写物の開始部分に位置していたんだ。

研究者たちは、少なくとも2つの研究で確認されたuORFに焦点を当て、その結果、2,199の高い信頼度を持つuORFの小さいセットにたどり着いたんだ。

uORFの保存状態のチェック

人間は遺伝的に非常に似ているから、uORFが本当に遺伝子の一部なら、異なる人間のゲノムで一貫して見つかるはずなんだ。研究者たちは、参照の人間ゲノムの配列をいくつかの他のゲノムと整列させることでこれを確認したんだ。uORFがDNAの同じ場所に存在し、その遺伝子を発現させるRNAと一致しているかも確認する必要があったんだ。

uORFをさまざまなゲノムに整列させた結果、大多数の87.8%がチェックしたすべてのゲノムで保存されていることがわかったんだ。この一貫性は、これらのuORFが本当に私たちの遺伝子コーディングの有効な部分を示す可能性があることを示唆しているんだ。

新しい転写物の構築

次のステップは、RNAの異なる部分の接続点、つまりスプライス接合部を探すことだったんだ。実験データとコンピュータプログラムからの予測を組み合わせて、uORFにリンクできる新しいタンパク質コーディング配列を作成したんだ。新しく構築する配列が既存の遺伝子に長さと構造で密接に一致することを確認したんだ。

研究者たちはこれらのuORFと既存のタンパク質コーディング遺伝子の間に何千もの新しい接合部の可能性を特定したんだ。その接続を基に、約5,000の新しい転写物を構築したんだ。

タンパク質構造の評価

タンパク質がどのように折りたたまれるかを予測する高度なツールを使って、研究者たちはこれらのuORFに関連する転写物から作られた新しいタンパク質を調べたんだ。予測されたタンパク質構造の質を評価するためにスコアリングシステムを使ったんだ。新しいタンパク質が参照と似た高いスコアを持っていると、機能的である可能性が高いんだ。特に、新しいタンパク質が参照のものと比べて改善された構造を示すケースに焦点を当てたんだ。

新しいタンパク質の中には、特定の部分の伸長や締め付けなど、構造的改善を示すものが多かったんだ。これらは、新しいタンパク質が以前理解されていたものよりも機能的なバリアントである可能性を示唆しているんだ。

タンパク質構造の共通の変化

研究者たちが観察した共通の変化は「エンドトランケーション」で、タンパク質の特定の無構造領域が取り除かれることだったんだ。これがしばしば安定性と機能の向上をもたらすことがあり、さまざまな例で確認されているんだ。時には、アルファヘリックスやベータシートのような新しい構造的要素を追加することで、タンパク質の折りたたみ結果が良くなることもあるんだ。

研究者たちはこれらの変化がどれくらい起こったかを追跡して、さまざまな改善を見つけたんだ。こうした改善は、これらの新しいタンパク質バリアントが体内で効果的に機能する可能性を示唆しているんだ。

uORFとその可能性についての結論

この研究からの主な結論は、これらのuORFの多くが完全に新しい遺伝子ではなく、既存の遺伝子の延長として機能するかもしれないってことなんだ。uORFを既知の遺伝子と結びつけることで、研究者たちは人間の遺伝学に新しいタンパク質のバリエーションの層を加えることができるんだ、必ずしも新しい遺伝子のカテゴリーを大量に追加する必要はないんだ。

複数の証拠を用いた構造化されたアプローチで、研究者たちはこれらのuORFが人間の生物学で果たす役割を明らかにしたいと思ってるんだ。今後の研究がこれらの領域をさらに調査して、その重要性と既存の遺伝子との関係を深く理解するために必要なんだ。結果は有望で、特に変異がタンパク質の機能にどう影響するか、人間の健康にどんな影響があるのかを理解するための新しい道を開くかもしれないんだ。

オリジナルソース

タイトル: Upstream open reading frames may contain hundreds of novel human exons

概要: Several recent studies have presented evidence that the human gene catalogue should be expanded to include thousands of short open reading frames (ORFs) appearing upstream or downstream of existing protein-coding genes, each of which would comprise an additional bicistronic transcript in humans. Here we explore an alternative hypothesis that would explain the translational and evolutionary evidence for these upstream ORFs without the need to create novel genes or bicistronic transcripts. We examined 2,199 upstream ORFs that have been proposed as high-quality candidates for novel genes, to determine if they could instead represent protein-coding exons that can be added to existing genes. We checked for the conservation of these ORFs in four recently sequenced, high-quality human genomes, and found a large majority (87.8%) to be conserved in all four as expected. We then looked for splicing evidence that would connect each upstream ORF to the downstream protein-coding gene at the same locus, thus creating a novel splicing variant using the upstream ORF as its first exon. These protein coding exon candidates were further evaluated using protein structure predictions of the protein sequences that included the proposed new exons. We determined that 582 out of 2,199 upstream ORFs have strong evidence that they can form protein coding exons that are part of an existing gene, and that the resulting protein is predicted to have similar or better structural quality than the currently annotated isoform. Author SummaryWe analyzed over 2000 human sequences that have been proposed to represent novel protein-coding genes, and that reside just upstream of known genes. These "upstream ORFs" (uORFs) would represent a surprisingly large addition to the human gene catalogue, which after decades of refinement now contains just under 20,000 protein-coding genes. They would also create over 2000 new bicistronic genes, which number only 10 in current human annotation databases. We hypothesized that rather than novel genes, these sequences might instead represent novel exons that can be spliced into existing protein-coding genes, creating new isoforms of those genes. Using a combination of transcriptional evidence and computational predictions, we show that at least 582 of the previously-described uORFs can be used to create novel protein-coding exons, generating new transcripts and new protein isoforms, but not requiring the addition of entirely new genes to the human gene catalogue. We also demonstrate that the predicted three-dimensional structure of some of the new protein isoforms hints at new or improved functions for existing proteins.

著者: Hyun Joo Ji, S. L. Salzberg

最終更新: 2024-04-01 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.03.22.586333

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.03.22.586333.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事