コラボでタンパク質データの精度を向上させる
Folditのプレイヤーたちがタンパク質モデルを改善して、科学研究の質を高めてるんだ。
― 1 分で読む
プロテインデータバンク(PDB)は、生物分子、特にタンパク質に関する情報を保存する重要なリソースだよ。科学者たちはタンパク質の仕組みや構造を研究するために使ってる。PDBに正確な情報があることはめっちゃ大事で、たくさんの科学者がそれに頼ってアイデアを作ったりテストしたりしてるんだ。データが間違ってると、研究の進展を遅らせるミスに繋がっちゃう。
タンパク質データの課題
PDBに載ってるタンパク質の構造には、データの収集方法のせいでエラーが起こることがあるよ。タンパク質構造データを集めるための一般的な方法は、結晶学とクライオ電子顕微鏡(クライオEM)だね。どちらの技術も分子内の電子の位置に関する間接的な証拠を提供する。でもこの情報には限界があって、実験のエラーや解像度の低さで画像がはっきりしないことも。科学者たちはこのはっきりしない画像に基づいて原子を当てはめようとするから、エラーが起きることもあるんだ。
PDBは提出されたモデルを徹底的にチェックする必要がないから、エラーのあるエントリーがたくさんあるよ。エラーの内容はどうでもいい小さな間違いから、研究を誤解させる重大な問題までさまざまだ。PDBにある構造やデータの数が多いせいで、科学者たちがどんなに頑張ってもミスが見逃されやすいんだ。
PDB-REDOプロジェクト
これらの問題のいくつかを解決するために、PDB-REDOプロジェクトが2006年に始まったよ。このプロジェクトの目標は、PDBにあるタンパク質構造モデルを自動的に洗練させて正確さを向上させること。今までのところ、PDB-REDOプロジェクトは成功していて、実験データによりよく合うように洗練された17万以上のエントリーをホストしてる。
PDB-REDOの努力にもかかわらず、いくつかの構造モデルにはまだ改善が必要なんだ。自動洗練プロセスは多くの問題にはうまくいくけど、限界もある。場合によっては、洗練されたモデルの質がまだ低いままなんだ。それで、さらにこれらの構造を強化するための新しい方法が必要なんだ。
Folditの役割
PDBの構造を改善するための革新的なアプローチの一つは、Folditというビデオゲームのプレイヤーを巻き込むことだよ。このゲームでは、プレイヤーがタンパク質構造に関連するパズルに挑戦できるんだ。彼らは協力して、競い合いながらタンパク質の最良のモデルを作る。これまでの競技では、プレイヤーが一部の科学者やコンピューターアルゴリズムよりも良いモデルを作れることが証明されたよ。
FolditのプレイヤーがPDBにある構造を改善できるかどうかを確かめるために、「再構築パズル」という新しいパズルが作られたんだ。このパズルでは、プレイヤーには既存のタンパク質モデルと電子密度を表すデータマップが与えられて、構造を改善する仕事をしてもらった。
再構築パズルの結果
58個のパズルが完了した後、プレイヤーの解答が分析された。結果は、39のケースでFolditモデルから始めると、構造の質が向上したことを示してた。一般的に、Folditプレイヤーが作ったモデルは、化学的および物理的特性がより良く、多くの状況で実験データへの適合も改善されたんだ。
構造の質を評価するために多くの指標が使われた。特に「Molprobity ClashScore」という指標では、Folditプレイヤーによって作られたモデルの構造的な衝突が大幅に減少したことが示された。
パズルの例では、プレイヤーが行った変化が強調されていた。一例では、特定の残基が明らかな位置のシフトを示し、生物機能における重要性を浮き彫りにしてた。こういった変化は、タンパク質構造の小さなシフトでも機能に大きな影響を与える可能性があることを示してる。
プレイヤーの分析と認識
再構築パズルの成功を受けて、Folditパズルからのデータを自動的に評価してPDB-REDOデータベースに組み込む新しいシステムが設立された。Folditのプレイヤーが同意すれば、彼らの名前が公開されるモデル改善に対してクレジットされるんだ。
プレイヤーが構造をどのように改善したのかを理解するために、何人かのプレイヤーに彼らの戦略を尋ねた。彼らのアプローチは大きく異なってたよ。多くの人は、手動調整と自動ツールの組み合わせを使ってた。場合によっては、トップソリューションはスクリプトに頼ってたことが示唆されていて、自動的に構造をフィットさせる方法が改善できる余地があることを示してる。
継続的な努力
再構築パズルの成功は、その継続を促してる。現在、これらのパズルは洗練された結晶学モデルに焦点を当ててるけど、クライオEMモデルにもこのアプローチを拡張する予定だよ。データ収集の両方の方法で似たような課題が現れ、Folditのプレイヤーがこれらの問題を解決する重要な役割を果たせるかもしれない。
科学における人間の貢献の重要性
技術が進化して人工知能ツールが科学の分野で登場する中、改善努力における人間の参加から見られる成功は、貴重なリマインダーとして機能してる。個人の独自の洞察や創造性は、科学の進展を大いに促進できる。AIは強力な能力を提供するけど、構造生物学のような複雑な分野で情熱的でやる気のある個人が果たす貢献を見逃さないことが大事なんだ。
結論
要するに、PDB-REDOプロジェクトのような進展がタンパク質構造モデルの洗練において strides を作った一方で、Folditのようなプラットフォームを通じた市民科学者の参加はさらなる改善の可能性を示してる。構造生物学の風景が進化する中で、技術と人間の創造性のコラボレーションが、科学的理解や発見を向上させる道を切り開き続けてる。自動ツールと個人の独自のスキルの組み合わせが、私たちが生命の基本的な構成要素を理解するために頼るデータを豊かにする大きな可能性を秘めてるよ。
タイトル: Reconstructing Biological Molecules with Help from Video Gamers
概要: Foldit is a citizen science video game in which players tackle a variety of complex biochemistry puzzles. Here, we describe a new series of puzzles in which Foldit players improve the accuracy of the public repository of experimental protein structure models, the Protein Data Bank (PDB). Analyzing the results of these puzzles showed that the Foldit players were able to considerably improve the deposited structures and thus, in most cases, improved the output of the automated PDB-REDO refinement pipeline. These improved structures are now being hosted at PDB-REDO. These efforts highlight the continued need for the engagement of the lay population in science.
著者: Scott Horowitz, A. Petrides, R. Joosten, Foldit Players, F. Khatib
最終更新: 2024-06-24 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.06.19.599674
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.06.19.599674.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。