ゼブラフィッシュと機械学習を使った薬の発見の進展
研究者たちはゼブラフィッシュの行動とAIを利用して新しい薬の発見をしてるよ。
― 1 分で読む
薬が中枢神経系(CNS)にどう影響するかの研究は複雑なんだ。ケタミンみたいに昔からある薬でも、どうやって作用するかはハッキリしてないんだよね。これは脊椎動物の神経系に関わる複雑な経路があるから。多くの薬は複数のターゲットに影響を与えるから、一つのターゲットにだけ作用する薬を開発するのが難しいんだ。
この課題に対処するために、研究者たちは表現型スクリーニングと呼ばれる方法を使ってる。この技術は、さまざまな化合物が体の中でどんなふうに異なるターゲットに相互作用するかを特定するのを助けるんだ。研究者たちは、より高い生物学的複雑性を持つモデルシステムでこれらの化合物の影響を調べることで、貴重な洞察を得られるんだ。ゼブラフィッシュの幼虫を使うのが人気になってきてて、これは研究者が何千もの化合物を迅速にテストできて、人間と似た遺伝子とCNSの構造を持ってるからなんだ。
ゼブラフィッシュでの表現型スクリーニングは新しい薬を発見するのに期待が持てるけど、スクリーニングで集まった大量の行動データを分析するのは難しい。実験中に撮ったビデオには、魚がさまざまな刺激にどう反応するかの情報がたくさん含まれてるんだ。従来のデータ評価方法は微妙な行動の変化を検出するのに苦労することが多い。
スクリーニングプロセス
スクリーニングプロセスでは、ゼブラフィッシュの幼虫を96ウェルプレートに置いて、いろんな薬にさらすんだ。研究者は、音やカラフルな光みたいな異なる刺激に対する反応を観察する。魚の行動はビデオに録画されて、その後「運動指数」(MI)を計算するために分析される。
MIの時系列データを評価するための異なる方法は、結果がバラバラになることがある。たとえば、相関距離を使った単純な比較は、微妙な行動の変化を区別するのに効果的じゃないかもしれない。魚はしばしば複雑な反応を示すから、簡単には捉えられないんだ。従来の指標はビデオのフレームのすべての部分を平等に扱うから、重要な動きを評価するのがうまくいかないことがある。
このデータの分析を改善するために、研究者たちは双子のニューラルネットワーク(双子-NN)と呼ばれる深層学習技術に目を向けた。このモデルは、さまざまな行動反応をもっと効果的に区別できるように学んで、異なる薬の影響を理解するために重要なデータの側面に焦点を当てることができるんだ。
双子のニューラルネットワークを使う
最近の研究では、研究者たちは約650種類の薬のライブラリを使って双子-NNを訓練し、それをゼブラフィッシュで誘発される行動変化にリンクさせた。このモデルは、各薬によって引き起こされる行動のニュアンスをよりよく捉えるように設計されて、効果的な化合物をより正確に特定できるようにしてるんだ。
ゼブラフィッシュを機械学習技術と組み合わせることで、研究者たちは大規模なデータセットをより効率的に分析できるようになった。双子-NNは、ポジティブペア(同じ薬からの2つのサンプル)とネガティブペア(異なる薬のサンプル)を見分けるんだ。つまり、モデルは投与された薬に基づいて反応がどれくらい似てるかを評価するのを学ぶことで、全体的な薬の発見プロセスを向上させるんだ。
調査によると、相関やユークリッド距離みたいな従来の方法は、複雑な行動データを扱うときにしばしばうまくいかないことが分かった。でも、双子-NNモデルは、薬のレプリカを効果的に特定する素晴らしい能力を示して、影響に微妙な違いがある薬を区別することもできたんだ。
データ分析の課題
双子-NNモデルの利点にも関わらず、研究者たちは実験の際にいくつかの課題に直面した。大きな問題の一つは、モデルが「ショートカット学習」に頼ることがあったこと。これは、データ内の意図しないパターンを悪用して、本当の関係を理解するのではなくなっちゃうこと。たとえば、もし薬が常に同じプレートの位置にあったら、モデルはその情報に依存してしまうかもしれない。
この問題を克服するために、研究者たちはランダム化されたセットアップで第二のスクリーニングを行うことにした。今回は薬の位置を混ぜて、レイアウトからのバイアスを排除したんだ。このアプローチを通じて、より信頼できるデータを集めて、モデルが実際の薬の効果を学ぶことができるようにしたんだ。
強固な実験デザインの開発
再設計された実験セットアップは、より正確な分析を可能にした。ランダム化アプローチを使うことで、学習モデルを誤解させる混乱要因を排除できた。新しいデータセットで訓練された双子-NNモデルは、異なる薬を区別するのに従来の距離指標を超えて非常にうまく機能したんだ。
さらに、精緻化されたスクリーニングによって、以前は見落とされがちだった行動反応を特定できるようになった。これは薬の発見努力全体の質を向上させるために重要で、モデルが異なるデータセットに対して一般化できるようにするためにも大事だった。
ビヘイビオロームの構築
双子-NNモデルから得られた表現型データを使って、研究者たちは「ビヘイビオローム」を構築した。これは、ゼブラフィッシュで誘発される行動に基づいて薬同士の関係を視覚的に表現したものなんだ。このマッピングは、薬の類似点や違いを包括的に把握できるようにして、新しい治療効果や薬の再利用の機会についての洞察を提供するんだ。
ビヘイビオロームは、似た作用機序を持つ薬の明確なクラスターを強調し、さらなる調査が必要な分野も明らかにした。たとえば、特定の治療クラスの薬はしばしば一緒にグループ化されて、関連する生物学的経路を通じて作用する可能性が示唆された。
新しい化合物の発見
この研究のワクワクする成果の一つは、神経活性効果のある新しい化合物の成功した特定だった。知られている薬から学んだ距離を、未知の化合物のライブラリと比較することで、どの新しい化合物が既存の薬と似た行動効果を示すかを予測できたんだ。
研究者たちは、これらの新しい化合物の潜在的な作用機序を予測するためのツールを使った。化合物とその予測される効果の間の関係を見つけることで、新しい発見の重要性をよりよく評価できたんだ。
選ばれた新しい化合物をテストする実験では、いくつかが神経活性効果に関連するヒト受容体に結合する可能性を示唆し、学習した距離指標が活性化合物を特定するのに役立つことを確認したんだ。
実験的な検証の展望
次に、研究者たちは予測を実験的に検証しようとした。選ばれた新しい化合物のセットをラボでテストして、どれくらい特定の受容体に結合するかを調べた。このステップは、機械学習モデルによって行われた予測が実際の効果につながるかを確認するために重要だったんだ。
テストの結果、かなりの割合の新しい化合物が意味のある結合親和性を示した。この高いヒット率は、ゼブラフィッシュの行動スクリーニングと現代の機械学習技術を合わせた薬の発見の効果を強調してるんだ。
結論
この研究は、深層メトリック学習モデルを、高レプリケートのゼブラフィッシュ行動スクリーニングと組み合わせて新しい神経活性化合物を特定する可能性を示してる。アプローチは複雑な薬理データへの洞察を提供して、さまざまな薬が生物系とどう相互作用するかをよりよく理解するのを促進するんだ。
ショートカット学習のような課題が存在するけど、実験デザインの改善がより信頼できる結果をもたらし、将来の薬の発見や開発に向けた道を切り開いてる。この方法論は、新しい治療薬を発見したり、それらが中枢神経系内でどう作用するかを解明するのに強力なツールになるかもしれない。
全体として、行動表現型と先進的な機械学習技術の統合は、神経活性薬の理解を進め、薬の発見プロセスを改善する大きな可能性を秘めてるんだ。方法論が進化し続ける中で、神経疾患のための革新的な治療法を発見する可能性は広がって、わくわくするね。
タイトル: Deep phenotypic profiling of neuroactive drugs in larval zebrafish
概要: Behavioral larval zebrafish screens leverage a high-throughput small molecule discovery format to find neuroactive molecules relevant to mammalian physiology. We screened a library of 650 central nervous system active compounds in high replicate to train a deep metric learning model on zebrafish behavioral profiles. The machine learning initially exploited subtle artifacts in the phenotypic screen, necessitating a complete experimental re-run with rigorous well-wise randomization. These large matched phenotypic screening datasets (initial and well-randomized) provided a unique opportunity to quantify and understand shortcut learning in a full-scale, real-world drug discovery dataset. The final deep metric learning model substantially outperforms correlation distance-the canonical way of computing distances between profiles-and generalizes to an orthogonal dataset of novel druglike compounds. We validated predictions by prospective in vitro radio-ligand binding assays against human protein targets, achieving a hit rate of 58% despite crossing species and chemical scaffold boundaries. These newly discovered neuroactive compounds exhibited diverse chemical scaffolds, demonstrating that zebrafish phenotypic screens combined with metric learning achieve robust scaffold hopping capabilities.
著者: Michael J. Keiser, L. Gendelev, J. Taylor, D. Myers-Turnbull, S. Chen, M. N. McCarroll, M. R. Arkin, D. Kokel
最終更新: 2024-02-25 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.02.22.581657
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.02.22.581657.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。