Simple Science

最先端の科学をわかりやすく解説

# 生物学# 分子生物学

S-パルミトイル化サイトの特定における進展

新しいモデルがタンパク質のS-パルミトイレーティング部位を予測して、タンパク質修飾の理解を深めてるよ。

― 1 分で読む


新しいモデルがS新しいモデルがSパルミトイル化サイトを予測しますミトイル化の検出を強化する。モデルは膜貫通タンパク質におけるS-パル
目次

タンパク質のS-パルミトイル化は、タンパク質を修飾して特定の部分にパルミテートという脂肪のような分子を追加するプロセスなんだ。この変化は、タンパク質が細胞膜にくっつくのを助けて、機能にとって重要なんだよ。細胞内のシグナル伝達で大事なRasファミリーのGTPアーゼなんかは、S-パルミトイル化を頼りに細胞膜の正しい場所にいるんだ。

膜貫通タンパク質は細胞膜を跨いでいるんだけど、S-パルミトイル化は周りの脂肪層(脂質二重層)に対してタンパク質の形を作るのに役立ってる。この修飾は、細胞同士のコミュニケーションや物質の取り込み方など、多くの生物学的活動にとって重要なんだ。ウイルス、特にコロナウイルスでは、スパイクタンパク質のS-パルミトイル化がウイルスの構造や複製能力にとって重要なんだ。

機械学習と勾配ブーステッドツリー

勾配ブーステッドツリー(GBT)は機械学習で使われる方法で、モデルの予測精度を改善するのに役立つんだ。このモデルは柔軟で、さまざまなデータにうまく対応できる。GBTは、ナイーブベイズやロジスティック回帰みたいな他の方法よりも予測結果が良いことが多いんだ。

分子生物学の分野では、GBTはO-リン酸化やタンパク質と小分子の相互作用の予測に使われてきたけど、S-パルミトイル化の部位を発見するにはあまり使われていないんだ。

現在の知識のギャップ

S-パルミトイル化が多くのタンパク質にとって重要だと知られているけど、どんな理由でタンパク質がこのように修飾されるのかの理解はまだ限られているんだ。ほとんどの研究は個々のタンパク質を調べてきたから、見方が狭くなっちゃってる。初期の研究では、S-パルミトイル化には脂質二重層からの距離が重要だって言われてたけど、すべての膜貫通タンパク質に当てはまるような普遍的なパターンは見つかっていないんだ。

他の修飾と同じように、S-パルミトイル化のシグナルと期待されているものは、これらのタンパク質にはあまり関係ないみたいなんだ。それでも、S-パルミトイル化はタンパク質が膜のどこに行くか、細胞に取り込まれる方法、他のタンパク質とどのように集まるかに影響を与えることは示されているんだ。

膜貫通タンパク質におけるS-パルミトイル化

膜貫通タンパク質は、哺乳類のタンパク質の中で大きな部分を占めていて、シグナル伝達や薬のターゲットとしての役割を果たしてるんだ。これらのタンパク質は脂っこい部分があるから、標準的な技術で研究するのが難しいんだよ。S-パルミトイル化によって修飾されることができるシステイン残基は、この脂っこい部分にしばしば見られるから、研究者たちは従来の方法では多くの潜在的なS-パルミトイル化部位を検出できないかもしれないと考えているんだ。

そこで、研究者たちは大規模なタンパク質データセットを解析して、以前に特定されたS-パルミトイル化部位に一致するシステインを含むペプチドを見てみたんだ。多くの部位は識別できたけど、細胞膜の近くにある多くの潜在的なS-パルミトイル化場所は、高スループット実験では見逃されてしまったみたいなんだ。

信頼できるデータセットの構築

S-パルミトイル化部位を特定するモデルを訓練するための信頼できるデータセットを作るために、研究者たちは、サイト指向変異導入や放射線標識など非常に正確な方法を用いた研究のデータに注目したんだ。これにより正確である可能性の高いデータを手に入れたよ。フィルタリングの後、いくつかのS-パルミトイル化部位とかなり多くの非S-パルミトイル化部位が含まれるデータセットができたんだ。

この訓練データセットを分析したところ、S-パルミトイル化された部位は膜の表面近くに位置する傾向があることが明らかになったんだ。この発見は、S-パルミトイル化が膜の近くの特定の場所で起こることが多いという以前の実験的証拠とも一致しているんだ。

疎水性領域の重要性

S-パルミトイル化が細胞質と膜の界面近くで起こることが多いから、研究者たちはこれらの領域の疎水性に注目したんだ。彼らはS-パルミトイル化が起こる可能性のある場所を理解するために、システイン残基の周りの全体的な疎水性を計算したんだ。S-パルミトイル化部位は、疎水性の大きな変化がある場所に多く見られることがわかったよ。

さらに、S-パルミトイル化されたシステイン残基は近くのシステイン残基とクラスターを作る傾向があることが観察され、これらの場所がS-パルミトイル化に関して協力するかもしれないことを示しているんだ。

GBTモデルの訓練

研究者たちは、バイオデータの複雑さを扱うのに強力な勾配ブーステッドツリー法を使ってモデルを作ったんだ。彼らは異なる設定を試してみて、良いパフォーマンスを出すパラメータのセットを見つけたよ。このモデルは、訓練データとは異なるウイルスタンパク質のデータセットでテストされたんだ。

このモデルは新しいデータセットでのS-パルミトイル化部位の予測に強いパフォーマンスを示して、信頼できるツールになりそうだって感じたんだ。

マウスのタンパク質へのモデルの適用

モデルの検証が終わった後、研究者たちはマウスの膜貫通タンパク質のコレクションに適用したんだ。5009個のマウスの膜貫通タンパク質を調べて、システイン残基がたくさんあったんだ。モデルは、S-パルミトイル化される可能性が高い多くのシステイン部位を特定して、モデルが潜在的なS-パルミトイル化部位と、大多数の修飾されない部分を区別できることを示唆したよ。

予測された部位の中で、多くは既存のデータベースに以前は報告されていなかったもので、モデルが新たなS-パルミトイル化部位を発見する能力を示しているんだ。

実験的確認と応用

モデルをテストするために、研究者たちはVamp5とAquaporin-5の2つの膜貫通タンパク質をさらに研究することにしたんだ。モデルの予測を実験データと照らし合わせて確認したよ。Vamp5については、モデルが以前は報告されていなかった特定のシステインの位置を予測したけど、実験でそれがS-パルミトイル化部位であることが確認されたんだ。

Aquaporin-5もモデルからの良い予測が出て、将来の研究でのさらなる発見に向けての可能性を強化しているんだ。

新しいS-パルミトイル化部位の設計

このモデルのもう一つの面白い応用は、通常はこのように修飾されないタンパク質に新しいS-パルミトイル化部位を設計することなんだ。研究者たちは、システイン残基を持っているけどS-パルミトイル化のことが知られていないタンパク質(KDELレセプター2)を選んで、潜在的な部位を特定するためにモデルを使ったんだ。

実験でも、設計した部位が実際にS-パルミトイル化されることが確認されて、このアプローチがタンパク質修飾の新たな発見に繋がることを示しているんだ。

結論

タンパク質のS-パルミトイル化は、細胞のプロセスに影響を与える重要な修飾なんだ。勾配ブーステッドツリーに基づいたTopoPalmTreeというモデルの開発は、膜貫通タンパク質における潜在的なS-パルミトイル化部位を特定するための新しいツールを提供するよ。新しい部位を発見したり、さらには新しい部位を設計したりする能力は、このモデルの汎用性と今後のタンパク質生物学研究への可能性を明らかにしているんだ。

S-パルミトイル化の理解が深まるにつれて、TopoPalmTreeみたいなツールは、これらの重要な修飾を探求・操作する能力を高めて、バイオテクノロジーや医療での新たな発見の道を切り開いていくことになるんだ。

オリジナルソース

タイトル: Topology-Driven Discovery of Transmembrane Protein S-Palmitoylation

概要: Protein S-palmitoylation is a reversible lipophilic posttranslational modification regulating a diverse number of signaling pathways. Within transmembrane proteins (TMPs), S-palmitoylation is implicated in conditions from inflammatory disorders to respiratory viral infections. Many small-scale experiments have observed S-palmitoylation at juxtamembrane Cys residues. However, most large-scale S-palmitoyl discovery efforts rely on trypsin-based proteomics within which hydrophobic juxtamembrane regions are likely underrepresented. Machine learning- by virtue of its freedom from experimental constraints - is particularly well suited to address this discovery gap surrounding TMP S-palmitoylation. Utilizing a UniProt-derived feature set, a gradient boosted machine learning tool (TopoPalmTree) was constructed and applied to a holdout dataset of viral S-palmitoylated proteins. Upon application to the mouse TMP proteome, 1591 putative S-palmitoyl sites (i.e. not listed in SwissPalm or UniProt) were identified. Two lung-expressed S-palmitoyl candidates (synaptobrevin Vamp5 and water channel Aquaporin-5) were experimentally assessed. Finally, TopoPalmTree was used for rational design of an S-palmitoyl site on KDEL-Receptor 2. This readily interpretable model aligns the innumerable small-scale experiments observing juxtamembrane S-palmitoylation into a proteomic tool for TMP S-palmitoyl discovery and design, thus facilitating future investigations of this important modification.

著者: Michael T Forrester, J. R. Egol, S. Ozbay, R. Singh, P. R. Tata

最終更新: 2024-09-08 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.09.08.611865

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.09.08.611865.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事

システムと制御連邦学習とモデルプルーニングでワイヤレスネットワークを改善する

フェデレーテッドラーニングとモデルプルーニングが無線ネットワークのパフォーマンスをどう向上させるかの見解。

― 1 分で読む