安全な報告のための薬の名前の標準化
新しいツールが薬の安全性データの正確さを向上させることを目指している。
― 1 分で読む
自発的報告システム(SRS)は、薬の安全性に関する潜在的な問題を追跡する上で重要な役割を果たしてるんだ。これらのシステムは、医療専門家や一般消費者など、さまざまなソースから薬に対する疑わしい反応の報告を集めるんだ。でも、報告はさまざまな地域やデータベースから来るから、データの収集や保存の方法に違いが出ちゃう。この多様性があるため、正確に情報を分析するのが難しくなる。特に、報告にはしばしばフリーテキストが含まれてて、これがごちゃごちゃしがち。スペルミスや欠落した詳細、重複エントリーなんかのミスがよく見られるんだ。だから、分析を行う前にデータをしっかりとクリーンにすることが重要だね。
最も広く使われているSRSの一つがFDAの副作用報告システム(FAERS)だ。このシステムは、世界中からデータを集めていて、特にアメリカのデータが強力に反映されてるから人気なんだ。FDAはFAERSデータにアクセスするための二つの方法を提供してるけど、結構違いがあるんだ。
一つ目のオプションは、事前処理されたデータにアクセスできる使いやすいオンラインダッシュボードだ。このダッシュボードは透明性を促進して報告の質を向上させることを目的としてるけど、いくつかの制限がある。データを準備するために使われるクリーンニングプロセスは完全には公開されてなくて、重複報告を見つけて取り除くステップも含まれてないんだ。だから、詳細分析を行いたい研究者にはこの形式は理想的じゃない。
二つ目のオプションは、研究者がダウンロードできる生の四半期データファイルだ。これらのファイルは、研究者が自分でクリーンプロセスを管理できる一方で、かなりの努力と意思決定が必要になる。研究者は、重複エントリー、あいまいな日付、一貫性のない情報をどう扱うかを決めなきゃいけない。この過程での選択は主観的なことが多くて、結果にも影響を与える。異なるクリーンニング方法は異なる結果をもたらす可能性があって、研究結果の信頼性に対する懸念が生じるんだ。
要するに、SRSが収集するデータはしばしば生の状態で一貫性がなくて、分析を行う前に医療知識に基づいた注意深いクリーンニングが必要なんだ。このプロセス全体で、専門家たちの間での協力が重要で、データ収集の方法や研究対象に関連する問題についての認識を保つ必要があるよね。さらに、研究者は自分のクリーンニング方法について透明性を持つことが大事で、他の人が彼らの発見を正しく評価し解釈できるようにすることが重要なんだ。
薬名に関する課題
データを分析する前に標準化が必要な重要なエリアの一つが、薬名の扱いだね。FAERSは薬名をフリーテキストとして収集するから、同じ薬が異なる名前で現れることがあるんだ。例えば、薬がブランド名や有効成分名、あるいはその両方で記録されることもあるよ。さらに、スペルミスや名前の書き方にバリエーションがあることが多くて、これが一貫性の欠如を引き起こすんだ。
薬名を標準化するのは難しいんだ。一つのブランド名が異なる国で異なる製剤を指すこともあるから。さらに、薬名の微妙なスペルの違いが異なるエントリーを生むこともある。そういう課題があるのに、薬名を標準化する最良の方法について合意がないことが多くて、FAERSデータを使った多くの研究は自分たちのクリーンプロセスを説明しないことが多い。こういう透明性の欠如が研究結果の再現性や信頼性を妨げるんだ。
いくつかのリソースが薬名の標準化を試みてるけど、アメリカの辞書しか使わないことが多くて、外国の名前やよくあるミスを見逃しちゃうんだ。いくつかの辞書は広範な薬情報をまとめてるけど、フリーテキストデータの複雑さには対応してないことが多い。その他のツールはスペルミスの自動修正を提供するけど、これが間違った翻訳を生むこともあるんだ。過去の試みでは明確な翻訳を作ろうとしたけど、公共のアクセスや透明性が欠けてることが多かった。
この研究の目的
この概要では、FAERSにおける薬の命名に関する課題に対処するための新しいオープンソースリソースを提案するよ。私たちのツール、DiAna辞書は、薬名の標準化を目的としてて、使用したクリーンニング方法の明確な報告を提供するものなんだ。この辞書は、研究者がFAERSデータをより良く管理し、分析の正確性や再現性を向上させる手助けをすることを目指してるんだ。
FAERSデータの理解
私たちはFAERSの四半期データファイルを集めて、ユニークな識別子でリンクされたさまざまなテーブルを含んでるんだ。これらのテーブルには、人口統計情報、薬の詳細、副作用、結果、報告のソースが含まれてるよ。私たちは、分析の質を向上させるために非常に重要な、薬名のクリーンアップと標準化に焦点を合わせたんだ。
DiAna辞書を作成するために、私たちは複数の四半期のデータを組み合わせて、薬を特定する特定の列をターゲットにしたんだ。薬名を有効成分に翻訳することを目的としてて、ブランドの検証ステータスなどの追加詳細は無視したんだ。関連する列からユニークな用語を集めてクリーンアップすることで、包括的な辞書を作る基盤を整えたんだ。
自動と手動のクリーンニング
最初に、確立されたソースから既知の成分に薬名を照合する自動プロセスを使用したんだ。予備リストを作成した後、一般的な薬名を手動で確認して正確性を確保したんだ。翻訳プロセスには、外国の薬名をチェックしてデータ入力中に発生したタイプミスを修正することが含まれてた。
薬名を有効成分に翻訳する際にさまざまな問題を特定したよ。一部の薬は複数の成分を含んでるから、すべての成分をメモして明確にリストしたんだ。同じ有効成分がアメリカと国際的に異なる名前で存在する場合は、国際的に認識されている名前を優先する決定をしたんだ。
また、不明瞭または不完全な報告の処理も行ったよ。例えば、特定の薬が言及されていない場合は、「薬なし」としてエントリーを標準化したり、薬名が特定できない場合は「不明」と変更したりしたんだ。
包括的な辞書の作成
初期のクリーンニングの段階が終わった後、薬名とその有効成分をリンクする包括的なDiAna辞書を作成したよ。このリソースはオープンソースで提供し、研究者や専門家がアクセスして、ニーズに基づいて修正したり強化したりできるようにしてるんだ。
薬剤監視の分野は、DiAna辞書から大きな利益を得られるんだ。これにより、より一貫性があり正確な報告が可能になって、薬の安全性問題の分析がより良くなり、研究結果の信頼性が高まるんだ。
DiAna辞書の利点
DiAna辞書は、FAERSデータベース内での検索やケース特定を改善するんだ。薬名の翻訳の正確性を高めることで、特定の薬に関連する報告の数を増やすことができるんだ。これにより、研究者が分析するためのより強固なデータが得られて、薬の安全性問題を見極めるための強いシグナルが得られるんだ。
例えば、DiAna辞書は、以前には記録されていなかった薬の否定的な反応のケースを特定するのを助けるんだ。薬名の改善された翻訳によって、研究者はケース検索において感度が高まり、薬に関連する潜在的な問題の調査がより情報に基づいたものになるんだ。
さらに、この辞書が確立された薬の分類システムに接続されていることで、データの文脈を提供することができる。この接続により、研究者は薬のクラスを分析して将来の研究に役立つトレンドやパターンを特定することができるんだ。
制限と将来の目標
DiAna辞書は重要な進展だけど、静的なツールではないんだ。新しい薬名や用語に対応するために、継続的なアップデートが必要になるよ。辞書は新しい情報を統合し、既存の翻訳を洗練させるにつれて進化していくんだ。
ユーザーは、あまり一般的でない薬名がまだ辞書に含まれていないかもしれないことを理解しておく必要があるね。だから、研究を行う前には用語を確認して、新しい翻訳を追加してリソースを継続的に強化することをお勧めするよ。
結論
DiAna辞書は、薬の安全性報告におけるデータの明確さと信頼性を高めるための重要なステップとして存在しているんだ。薬名の翻訳に対する透明で標準化されたアプローチを提供することで、このオープンソースリソースは薬剤監視研究の質を向上させることを目指しているんだ。
専門家たちの協力を促進し、継続的な改善を可能にすることで、DiAna辞書はより安全な薬の使用を確保し、薬剤監視研究における発見の全体的な信頼性を高める手助けができるんだ。最終的には、コミュニティ内で知識を共有することで、より良い薬の安全性実践が促進されて、公共の健康の成果が向上することが期待されるよ。
タイトル: Standardization of drug names in the FDA Adverse Event Reporting System: The DiAna dictionary.
概要: IntroductionThe FDA Adverse Event Reporting System (FAERS) receives drug names in various forms, including brand names, active ingredients, abbreviations, and misspellings, which creates challenges in nomenclature standardization. The lack of consensus on standardization strategies and of transparency hampers replicability and accuracy in conducting disproportionality analysis using FAERS data. AimWe have developed an open-source drug-to-ingredient dictionary called the DiAna dictionary (short for Disproportionality Analysis). Additionally, we have linked the DiAna dictionary to the WHO Anatomic Therapeutic Chemical (ATC) classification system. MethodsWe retrieved all drug names reported to the FAERS from 2004 to December 2022. Using existing dictionaries such as RxNorm and string editing techniques, we automatically translated the drug names to active ingredients. Manual revision was performed to correct errors and improve translation accuracy. The resulting DiAna dictionary was linked to the ATC classification, proposing a primary ATC code for each ingredient. ResultsWe retrieved 18,151,842 reports, with 74,143,411 drug entries. We automatically translated and manually checked the first 14,832 terms, up to terms occurring at least 200 times (96.88% of total drug entries), to 6,282 unique active ingredients. Automatic unchecked translations extend the standardization to 346,854 terms (98.94%). After linking to the ATC classification, the most prominent drug classes in FAERS reports were immunomodulating (37.40%) and nervous system drugs (29.19%). ConclusionWe present the DiAna dictionary as an open-source tool and encourage experts to provide input and feedbacks. Regular updates can improve research quality and promote a common pharmacovigilance toolbox, ultimately advancing safety and improving study interpretability. Key pointsO_LIDrug name standardization impacts signal detection accuracy. C_LIO_LIDiAna dictionary cleanses drugs in FAERS for improved data control. C_LIO_LIDiAnas transparency and flexibility improves interpretability. C_LI
著者: Michele Fusaroli, V. Giunchi, V. Battini, S. Puligheddu, C. Khouri, C. Carnovale, E. Raschi, E. Poluzzi
最終更新: 2023-06-12 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2023.06.07.23291076
ソースPDF: https://www.medrxiv.org/content/10.1101/2023.06.07.23291076.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。