薬の開発における特許文書
製薬の革新と研究における特許の役割を調べる。
― 1 分で読む
目次
特許文書は新しい発明の詳細を公開する法律文書なんだ。誰かが有効な特許を持っていると、その発明を特定の地域で約20年間独占的に生産、使用、販売する権利を得ることが多い。薬の開発の世界では、研究者たちがこれらの特許文書を見て、誰が似たような薬を開発しているのかを調べることが多い。大手製薬会社、大学、個々の発明者などがいるかもしれない。特許文書は医薬品化学者が薬のアイデアを改善し、既存の特許の範囲外で運用できるようにする手助けをしてくれるんだ。
製薬特許は特に薬の設計、創造、製造方法などに焦点を当てている。これらの文書は薬や生物製剤がどのように開発され、使用されるかについて貴重な洞察を提供する。基本的には、製薬業界の現状や活動を理解するためのリソースを形成しているんだ。
特許文書は通常、化学化合物自体とその化合物の用途についての2つの重要な要素を議論している。化学物質は、式や名前などのいくつかの形式で提示されることがある。これらの文書に提供されている詳細は、研究者が専門のソフトウェアやツールを使って化学特許を検索するための基盤となる。薬の用途は、特許の請求項や説明に通常記載されており、しばしば特定の法律用語で書かれている。この情報は、特許の弁護士や薬の研究を行う科学者にとって、特許に関する合法的に許可されている範囲を把握するために重要なんだ。
製薬特許の分析
製薬特許の検討は、現在のトレンド、発明の保護方法、新しい化学物質の特定など、多くの主題をカバーしている。たとえば、研究者は公共の特許データベースからさまざまな化合物を見つけて、それが特定の病気のための出発材料や関連化合物になる可能性があることを発見した。
これらの化合物を特定し、分類するために、研究者は分子の類似性やパターンを分析する特定の方法を使っている。このアプローチは、新しい化合物がどれだけユニークで特許を取得できるかを評価するのに役立つ。これまでに研究された特許のほとんどはアメリカの文書に焦点を当てていて、アメリカは最大の製薬市場を持っているだけでなく、使いやすい特許データベースが利用可能だからなんだ。これにより、特定の分類に一致する特許に研究が制限されることがあり、非製薬アイテムも含まれることがある。
SureChEMBLは、特許に見られる化合物を追跡する生命科学の有名な公開データベースだ。自動化された方法を通じて、これらの化合物を他のバイオメディカル情報と共に特定している。このデータベースは、各化合物の詳細な記録を保持していて、その構造や特許文書での言及部分が含まれている。この研究の目的は、SureChEMBLの化合物がすでに承認された薬とどのように関連しているかをチェックすることだ。研究者は、これらの特許化合物の分子構造や特性のパターンを見つけたいと考えている。また、これらの化合物が既存の薬にどれだけ似ているかを重要な特性で比較する予定なんだ。
アメリカの特許だけでなく、国際的な特許申請の幅広いバリエーションを調べることで、研究は化合物の医薬用途やその処方のより豊かな状況を提供しようとしている。研究者は、特許化合物が臨床試験を通じてどのように進展しているかも見ている。
特許データの概要
この研究では、2015年から2022年の間に提出された150万件以上の特許申請に存在する1000万以上の化合物のデータを収集した。この文書は、アメリカ、ヨーロッパ、日本、その他のグローバルな組織の特許庁からのものだ。特許申請のほとんどはアメリカとヨーロッパで見つかり、日本からはごく少数だった。
各特許文書には、特許が最初に提出された国を反映したユニークな識別番号がある。これらの番号を分析することで、研究者はアメリカとヨーロッパに提出された特許が多いことを発見した。研究では、ユーティリティ特許がこれらの地域で主流であることも指摘されており、実用的な発明に関する特許が含まれている。
研究者たちは特許の年間提出トレンドや、これらの申請に関連する化合物を調べた。彼らは、平均で年間約20万件の特許申請が提出され、各申請には通常約6つの化合物が参照されていることを発見した。特許化合物の一部は複数の特許に関連していたが、大部分はごく少数の文書で引用されていた。
データベースにおける化合物のカバレッジの理解
科学者や研究者がさまざまな化合物の生物学や活動を理解するのを助けるために、多くの公開データベースが存在している。特許文書の化合物が他のデータベースの化合物とどれだけ一致するかを分析するために、研究者は特許化合物の化学構造とPubChem、ChEMBL、DrugBankのものを比較した。彼らは、特許化合物のうち、医療用途として承認されているのはごくわずか(0.02%)であることを発見した。さらに、PubChemはSureChEMBLの特許化合物との重複が最も高いようだった。
分析はまた、SureChEMBLデータベースに特有の特許化合物の小さな割合を明らかにした。これらのユニークな化合物のほとんどはアメリカの特許文書から抽出された。研究者は最近数年で新しいユニークな化合物の発見が減少していることに注意を払った。
特許文書における画像の重要性
特許文書は、タイトル、要約、説明、請求項などのセクションに構成されている。化合物がこれらのセクションのどこに記載されているかを見つけることで、その特許の請求項に対する関連性がわかる。たとえば、説明に記載された化合物は、往々にして先行知識の一部であり、請求項に記載されたものは新しい発明に関連している可能性が高い。
SureChEMBLでは、特許文書は主にテキストと化学構造の画像を使用して化合物情報を抽出する。分析は、かなりの数の特許化合物が説明セクションから引き出されていることを示唆しており、これは特許文書における化合物を見つけるための重要なデータ源であることを示している。
薬の特性ルールへの準拠
潜在的な薬を評価するために、科学者は化合物が薬としてどれだけうまく機能するかを判断する化学的特性に基づいたガイドラインを作成している。有名なガイドラインの一つは「Rule of Five」で、良好な経口バイオアベイラビリティのための特定の特性を提案している。研究では、半数以上の特許化合物がこれらのガイドラインに適合し、より高度な特性を満たすものは少ないことがわかった。
承認された化合物とそうでない化合物に分類することで、分析は多くの化合物が基本的な薬の特性基準に準拠しているという一貫したトレンドを示した。一般的に見られる化合物には、特許文書に頻繁に現れるさまざまな糖やアミノ酸が含まれている。
特許化合物の構造多様性
最近、従来の薬の特性に厳密に従わない新しい治療化合物に対する関心が高まっている。特許化合物の調査では、特定の分子特性のトレンドが年々増加していることが示された。研究者は、これらの化合物の化学的特性を評価し、革新的な化合物がより多く創出されている兆候を観察した。
さらに、研究者は特許化合物のポリファーマコロジーを調査して、複数の生物学的ターゲットに影響を与える可能性がある化合物を見つけようとした。既知の問題のある構造を探すことで、研究は薬の試験に干渉したり、不必要な副作用を引き起こす可能性のある特許化合物の小さな数を特定した。
スキャフォールドと構造変化の探求
特許化合物の多様性をより理解するために、研究者は化合物を基本的な構造形式、つまりスキャフォールドに分解した。この分析は、特許化合物の中に数百万のユニークなスキャフォールドが表現されており、幅広い分子サイズをカバーしていることを示した。スキャフォールドの年間評価は、新しい構造が多く特許化されているものの、最近ではユニークなスキャフォールドの数が減少していることを示している。
発見は、特許化合物に存在する構造的多様性を強調していて、薬の開発における新しい領域の洞察を提供できる可能性がある。
承認された薬と特許文書の関連付け
承認された薬とその特許文書との関連を理解することは、発明が市場に出ていく過程を認識するために重要だ。多くの薬が特許保護の恩恵を受けている一方で、命名や分類の違いが薬を元の特許に戻すプロセスを複雑にしている。化学的な識別子を使用することで、研究は特許化合物と臨床試験を通過した化合物とのより明確な関連を作ろうと試みた。
研究者は、成功裏に臨床試験に達した特許化合物はごく少数であり、市場から撤回されたものはさらに少ないことを発見した。データは、ほとんどの化合物が開発の早い段階にあり、わずかにいくつかが医療用途に向けて承認されたことを示していた。
結論と今後の方向性
特許文書の研究は、薬の発見や新しい化合物の開発にとって価値がある。SureChEMBLデータベースを分析することで、研究者は特許化合物の潜在的な有用性、化学的多様性、特性、承認された薬に対する関連性を明らかにしようとしている。データ品質の問題や特許用語の解釈の課題といったいくつかの制限があるにもかかわらず、研究はこの分野のさらなる研究の基盤を築いている。
特許化合物の状況を理解することで、科学者たちは薬の発見プロセスをよりスムーズに進めることができる。今後の作業は、これらの発見に基づいてデータベースを改良し、新しい化学的領域を探求して、薬の開発における革新を促進し、古いまたは非効果的な化合物に関連するリスクを最小限に抑えることができる。
タイトル: Medicinal chemistry lens on patent data in SureChEMBL
概要: In the pharmaceutical industry, the patent protection of drugs and medicines is accorded importance because of the high costs involved in the development of novel drugs. Over the years, researchers have analyzed patent documents to identify freedom-to-operate spaces for novel drug candidates. To assist this, several well established public patent document data repositories have enabled automated methodologies for extracting information on therapeutic agents. In this study, we delve into one such publicly available patent database, SureChEMBL, which catalogues patent documents related to life sciences. Our exploration begins by identifying patent compounds across public chemical data resources, followed by pinpointing sections in patent documents where the chemical annotations were found. Next, we exhibit the potential of compounds to serve as drug candidates by evaluating their conformity to drug-likeness criteria. Lastly, we examine the drug development stage reported for these compounds to understand their clinical success. In summary, our investigation aims at providing a comprehensive overview of the patent compounds catalogued in SureChEMBL, assessing their relevance to pharmaceutical drug discovery.
著者: Yojana Gadiya, S. Shetty, M. Hofmann-Apitius, P. Gribbon, A. Zaliani
最終更新: 2024-04-08 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2023.11.27.568822
ソースPDF: https://www.biorxiv.org/content/10.1101/2023.11.27.568822.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。