タンパク質の構造と機能についての洞察
タンパク質の構造とそれが生物学での重要性についての概要。
― 1 分で読む
構造生物情報学の研究で、科学者たちはコンピュータを使ってタンパク質の三次元の形を調べてるんだ。タンパク質がどう機能するかについて重要な質問をするよ。大きな質問の一つは、遺伝子の配列がどうやって役立つタンパク質の形に変わるかってこと。もう一つは、二つのタンパク質の形を比べること。最後に、科学者たちは動きや柔軟性がタンパク質の働きにどう影響するかを知りたいんだ。
タンパク質構造の基本
タンパク質の構造のレベル
タンパク質にはいろんな構造のレベルがある。最初のレベルは一次構造って言って、アミノ酸が鎖の中で並んでる順番のこと。二次構造は、アルファヘリックス(螺旋)やベータシート(折り畳み)みたいな形を含んでる。三次構造は、全体の鎖がどう三次元の形に折りたたまれるかを指す。最後に四次構造は、複数のタンパク質の鎖が集まって複雑な形を作ること。
アミノ酸とその重要性
アミノ酸はタンパク質の構成要素だよ。20種類の自然なアミノ酸があって、いろんな組み合わせでタンパク質を作る。それぞれのアミノ酸には特有の性質があって、タンパク質がどう折りたたまれるかに影響するんだ。
タンパク質の折りたたみプロセス
タンパク質が作られるとき、最初は長いアミノ酸の鎖として始まるんだ。この鎖が特定の形に折りたたまれていくんだ。折りたたみの一つの重要な考え方は、疎水性の崩壊で、水を嫌う部分が集まって水から離れようとする。これが重要なのは、タンパク質の最終的な形がその機能にとって重要だから。
水素結合とタンパク質の形
水素結合は、タンパク質の構造を安定させるのに大事な役割を果たす。水素原子がわずかに正の電荷を持っていて、わずかに負の電荷を持つ他の原子に引き寄せられることで起こる。このおかげで、タンパク質の形が維持されるんだ。
一般的な構造的特徴
タンパク質は多様な形を持つことができる。一般的な構造にはアルファヘリックスやベータストランドがあって、これらは多くのタンパク質の機能に重要なんだ。これらの構造は水素結合を通じて互いに相互作用して、タンパク質をしっかりと保つ手助けをしてる。
シートの種類
ベータシートには主に二つの種類がある:平行と逆平行。平行シートでは、ストランドが同じ方向に走ってるけど、逆平行シートでは反対方向に走ってる。この違いがタンパク質の挙動に影響を与えることがあるんだ。
異常なタンパク質構造
一部のタンパク質は一般的な構造に当てはまらないことがある。例えば、アミロイドフィブリルは疾患に関連してる。その他のタンパク質は、構造がない領域を持っていて、形を簡単に変えられることがあるんだ。
構造決定技術
タンパク質構造の決定の難しさ
タンパク質の形を見つけるのは難しいことがある。科学者たちは、X線結晶解析、核磁気共鳴(NMR)、クライオ電子顕微鏡(クライオEM)など、いくつかの方法を使ってそれを調べるよ。それぞれの方法には利点と欠点があるんだ。
X線結晶解析の利用
X線結晶解析は、高解像度のタンパク質構造を取得するための最も一般的な方法だよ。タンパク質を結晶化して、X線がそれに当たって散乱する様子を調べるんだ。ただ、タンパク質を結晶化するのは難しいことがある。
核磁気共鳴(NMR)
NMRは別の技術で、主に小さなタンパク質に使われる。溶液の中でのタンパク質の情報を提供して、自然な環境での挙動を観察できるんだ。
クライオ電子顕微鏡(cryо-EM)
クライオEMは、大きなタンパク質の複合体を研究するのに便利だよ。結晶化なしで、タンパク質をそのままの状態で可視化できる。
タンパク質構造の解析
構造検証の重要性
科学者がタンパク質の構造を決定する際、測定が正確かどうかを確認するのが重要なんだ。このステップでモデルが現実を反映していて、化学や物理のルールに従っているかを保証するんだ。
品質確認のためのツール
タンパク質の構造を検証するためにいくつかのツールがあるんだ。これらのツールは、結合の長さや角度を確認して、既知のタンパク質構造に見られる期待される範囲内に収まっているかを確認する。
二次構造の割り当て
アルファヘリックスやベータシートのような二次構造を割り当てるのは手動でも、ソフトウェアを使ってもできる。このプロセスはタンパク質を分類して、その機能を理解するのに役立つんだ。
構造分類
新しいタンパク質構造が発見されるにつれて、それらを分類することが重要になる。分類は研究者が配列だけでは明らかでないタンパク質の関係を見つけるのに役立つんだ。
ドメインの定義
タンパク質はドメインと呼ばれる小さな部分に分けられる。これらのドメインは独立して折りたたまれて、機能することができるんだ。どこで一つのドメインが終わり、もう一つが始まるかを理解することは、タンパク質の働きを研究するのに重要だよ。
タンパク質配列とその関連性
配列と構造のリンク
タンパク質の三次元の形が重要だけど、そのアミノ酸配列にはその構造についての多くの情報が含まれているんだ。
タンパク質配列のデータベース
タンパク質の配列を保存してるデータベースがたくさんある。UniProtはその中でも重要なデータベースで、タンパク質の配列、機能、出所についての情報が豊富にあるんだ。
タンパク質構造のモデリング
予測モデルの必要性
タンパク質の構造を直接決定するのは難しくて時間がかかることがある。だから科学者たちは、配列に基づいてタンパク質がどう見えるべきかを予測するモデルを開発したんだ。
モデリングされた構造のリソース
Swiss-Model RepositoryやModBaseのようなデータベースは、モデリングされた構造へのアクセスを提供してるよ。Protein Modeling Portalのようなリソースもあって、いろんなツールで生成されたモデルを検索できるんだ。
構造予測の進展
AlphaFoldのような新しいツールの開発で、科学者たちが配列からタンパク質の構造を予測する方法が大幅に進展したんだ。この予測は役立つけど、特にタンパク質の無秩序な領域に関して限界があることもある。
機能データリソース
タンパク質の機能を理解する
タンパク質の構造はその機能と密接に結びついてる。タンパク質を完全に理解するためには、生物学的プロセスでの目的を見ることが不可欠なんだ。
ゲノムオントロジー
ゲノムオントロジー(GO)は、タンパク質が何をするかを生物学的プロセス、細胞構成要素、分子機能の三つの主要な分野で説明するシステムだ。このシステムを使うと、タンパク質をその機能に基づいて見つけたり分類したりしやすくなるんだ。
STRINGデータベース
STRINGは、どのタンパク質が互いに作用するかを特定するための便利なツールだ。いろんなソースからデータをまとめて、予測された相互作用に信頼スコアを割り当ててるんだ。
結論
要するに、タンパク質の構造、配列、機能を理解することは、構造生物情報学の分野にとって重要なんだ。研究者がこの分野で使えるリソースやツールがたくさんあって、タンパク質がどう働いて互いに相互作用するかを知る手助けをしてる。新しい技術やデータベースが開発され続けることで、研究者はタンパク質やその生物学的役割の複雑な世界を探求するための準備が整っているんだ。
タイトル: Data Resources for Structural Bioinformatics
概要: While many good textbooks are available on Protein Structure, Molecular Simulations, Thermodynamics and Bioinformatics methods in general, there is no good introductory level book for the field of Structural Bioinformatics. This book aims to give an introduction into Structural Bioinformatics, which is where the previous topics meet to explore three dimensional protein structures through computational analysis. We provide an overview of existing computational techniques, to validate, simulate, predict and analyse protein structures. More importantly, it will aim to provide practical knowledge about how and when to use such techniques. We will consider proteins from three major vantage points: Protein structure quantification, Protein structure prediction, and Protein simulation & dynamics. Structural bioinformatics involves a variety of computational methods, all of which require input data. Typical inputs include protein structures and sequences, which are usually retrieved from a public or private database. This chapter introduces several key resources that make such data available, as well as a handful of tools that derive additional information from experimentally determined or computationally predicted protein structures and sequences.
著者: Jose Gavaldá-Garciá, Bas Stringer, Olga Ivanova, Sanne Abeln, K. Anton Feenstra, Halima Mouhib
最終更新: 2023-07-06 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2307.02171
ソースPDF: https://arxiv.org/pdf/2307.02171
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://ctan.org/pkg/mdframed
- https://ctan.org/pkg/xcolor
- https://ctan.org/pkg/geometry
- https://orcid.org/#1
- https://tex.stackexchange.com/questions/156862/displaying-author-for-each-chapter-in-book
- https://www.rcsb.org/pdb/explore.do?structureId=#1
- https://arxiv.org/abs/#2
- https://www.rcsb.org/stats/summary
- https://www.uniprot.org/statistics/TrEMBL
- https://www.dtls.nl/fair-data/fair-principles-explained/
- https://www.rcsb.org/pdb/workbench/workbench.do
- https://rna.ucsc.edu/rnacenter/ribosome
- https://oldeurope.deviantart.com/art/GPCR-in-Lipid-Bilayer-focus-129477640
- https://www.rcsb.org/pdb/101/motm.do?momID=118
- https://www.rcsb.org/pdb/explore.do?structureId=1l9h
- https://www.rcsb.org/pdb/explore.do?structureId=1gue
- https://predictioncenter.org/casp12/gdtplot.cgi?target=T0886-D2
- https://predictioncenter.org/casp12
- https://www.rcsb.org/pdb/explore/explore.do?pdbId=5fhy
- https://proteinmodel.org/AS2TS/LGA/lga.html
- https://www.bmrb.wisc.edu/referenc/choufas.shtml