計算研究における再現性の向上
計算社会科学における再現性の課題に対処するためのオープンな取り組みと構造化された方法。
― 1 分で読む
目次
近年、科学研究を再現しやすくするアイデアがますます重要になってきてるよ。これは、特にデータやコンピュータ手法に依存する分野、つまり計算社会科学のような分野で、科学者が自分の発見を証明するのが難しいっていう課題から生まれた必要性なんだ。「計算再現性」ってのは、異なる研究者が分析を実行しても、同じデータとコードから同じ結果を得られる能力を指すんだ。
再現性の必要性
研究結果を再現し確認するのは、どれだけ重要か言い尽くせないよ。他の科学者がその結果を再現できて初めて、その正確性を確認できるんだ。でも、過去10年で多くの注目されたケースが、これがいつもそうじゃないってことを示してる。再現できなかった研究がたくさんあって、元の研究の信頼性に疑問を抱かせてる。この問題は、オープンサイエンスの実践への意識を高めるきっかけになったよ。
再現性の伝統的な見方
再現性は通常、2つの方法で定義される。1つ目は「複製」で、これは同じ方法で独立して全体の研究をもう一度行うことを指すけど、必ずしも元のデータを使う必要はないんだ。2つ目は「再現性」で、これは研究者が元のデータとコードを使って同じ数値結果に辿り着けることを意味してる。でも、この定義には限界があって、特に計算研究の文脈ではそうなんだ。
再現性の定義の拡張
計算社会科学では、この2つの定義だけに頼るのは全体像を捉えきれない。結果を再現するのは誰なのか(エージェント)と、再現が行われる場所(環境)を考慮することが重要なんだ。効果的な再現性のためには、両方の要素を考慮する必要がある。このより包括的な見方は、十分なチェックがなくても再現可能だと主張される結果を避けるのに役立つよ。
再現性の達成に向けた障壁
再現性を達成するのを妨げる障壁がたくさんあるんだ。これらの障壁は、必要なソフトウェアやデータセットへのアクセスといった実用的な問題から、研究が行われるさまざまな計算環境に関する複雑な課題まで多岐に渡る。これらの障壁を理解することは、それを克服する方法を見つけるために必須だよ。
アクセスの問題
データやソフトウェアへのアクセスは、再現性における一般的な課題だ。多くの科学研究は、公に利用できないデータセットに依存してることがある。研究者はしばしば、アクセスが時間とともに変わる専有のツールやサービスで作業しているんだ。たとえば、ソーシャルメディアプラットフォームはデータ共有ポリシーを頻繁に更新するから、研究者が研究を再現するために必要なデータを入手するのが難しくなってる。
計算環境の役割
研究が行われる環境は、再現性に大きな影響を与えるんだ。研究者は異なるコンピュータシステムやソフトウェアバージョン、ライブラリを使うことが多くて、それが結果の不一致を引き起こすことがある。他の人が発見を再現できるようにするには、すべての変数が考慮された制御された計算環境を確保する必要があるよ。そういう制御された環境には、使ったソフトウェアのドキュメント、関与したバージョン、データの処理方法が含まれるべきなんだ。
再現性のためのティアシステム
計算研究における再現性の課題に対処するために、ティアシステムを確立できるよ。このシステムは、再現を行うのが誰で、どの環境を使ったかによって再現性をいくつかのレベルに分類するんだ。
一次再現性(1 CR)
最も基本的なレベルの一次再現性は、同じデータセットで同じ分析を行った結果、同じ結果が得られることを意味するよ。この場合、元の著者が発見を検証するために必要なすべてを提供するんだ。でも、このレベルでは他の研究者からの外部の検証は必要ないんだ。
二次再現性(2 CR)
二次再現性は、信頼できる第三者が結果を検証できることを含むんだ。このシナリオでは、外部の研究者が元のデータと方法にアクセスできて、発見を確認できるようになってる。このレベルは、機密データや特殊な機器で作業する時に有益だよ。
三次再現性(3 CR)
三次再現性が最も高いレベルで、どの研究者でも共有されたデータとコードを使って発見を再現できるんだ。これを達成するには、オープンサイエンスの実践への強いコミットメントが必要で、研究者は自分の材料を気軽に共有し、方法を明確に文書化する必要があるよ。
オープンサイエンスの実践の重要性
オープンサイエンスの実践は、再現性を推進する上で重要な役割を果たしてる。データ、コード、研究方法を共有することで、科学者は協力と検証に適した環境を作り出すんだ。このオープンさは研究への信頼を高めて、他の人が既存の研究を基に発展させることを可能にし、より信頼性のある発見につながるよ。
教育イニシアティブ
再現性の文化を育むためには、トレーニングと教育が不可欠だよ。研究者は再現性のあるコードを書くスキルやデータを効果的に管理するスキルを身につける必要があるんだ。計算研究におけるベストプラクティスを強調する教育プログラムが推進されるべきで、これがこの学際的な分野の研究者間のスキルギャップを埋めるのに役立つよ。
再現性に向けた積極的アプローチ
問題が投稿後に発生するのを待つのではなく、研究者は積極的な戦略を採用すべきだよ。プロジェクトの開始時から再現性の原則を組み込むことで、後で時間やリソースを節約できるんだ。再現可能な研究コンペンディウムとして知られる構造化されたフレームワークにコードとデータを整理することで、研究者は自分の作業をより効果的に文書化する助けになるよ。
仮想化ツール
Dockerのようなツールは、標準化されたコンピュータ環境を作成・共有することで再現性を高められるんだ。これらのツールは計算環境のコンポーネントを文書化しやすくして、発見が一貫して再現できるようにするんだ。さらに、Linuxベースのシステムは成熟度と安定性があって、研究環境をホストするのに好ましいよ。
制度的な変更の必要性
再現性を改善するための努力は、制度的な変更も含むべきだよ。たとえば、学術ジャーナルは、著者が出版前に特定の再現性基準を満たすことを要求することができるんだ。このシフトは、研究者が再現性を優先し、自分の材料をよりオープンに共有することを促すだろう。
結論
再現性は科学研究、特に計算社会科学において重要な側面なんだ。再現性の定義を拡張し、障壁を克服するための措置を講じることで、研究者はより透明で信頼できる科学的な環境を作り出せるよ。オープンサイエンスの実践、積極的な戦略、制度的な変更を強調することで、科学者は他の人が検証できる成果を出すことができ、最終的に研究の整合性を強化できるんだ。これからは再現性を優先する環境を育てることで、個々の研究者だけでなく、より広い科学コミュニティにも利益をもたらすだろう。
タイトル: Computational Reproducibility in Computational Social Science
概要: Replication crises have shaken the scientific landscape during the last decade. As potential solutions, open science practices were heavily discussed and have been implemented with varying success in different disciplines. We argue that computational-x disciplines such as computational social science, are also susceptible for the symptoms of the crises, but in terms of reproducibility. We expand the binary definition of reproducibility into a tier system which allows increasing levels of reproducibility based on external verfiability to counteract the practice of open-washing. We provide solutions for barriers in Computational Social Science that hinder researchers from obtaining the highest level of reproducibility, including the use of alternate data sources and considering reproducibility proactively.
著者: David Schoch, Chung-hong Chan, Claudia Wagner, Arnim Bleier
最終更新: 2023-10-04 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2307.01918
ソースPDF: https://arxiv.org/pdf/2307.01918
ライセンス: https://creativecommons.org/licenses/by-sa/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://orcid.org/0000-0003-2952-4812
- https://orcid.org/0000-0002-6232-7530
- https://orcid.org/0000-0002-0640-8221
- https://dx.doi.org/10.1146/annurev-psych-020821-114157
- https://doi.org/10.1146/annurev-psych-122216-011845
- https://dx.doi.org/10.1126/science.aac4716
- https://dx.doi.org/10.1007/s11615-018-0131-7
- https://dx.doi.org/10.1093/joc/jqz052
- https://dx.doi.org/10.1093/joc/jqac017
- https://dx.doi.org/10.1080/19312458.2023.2167965
- https://www.science.org/doi/abs/10.1126/science.1167742
- https://dx.doi.org/10.1126/science.359.6377.725
- https://aclanthology.org/P13-1166
- https://aclanthology.org/J08-3010
- https://dx.doi.org/10.3389/fninf.2017.00069
- https://dx.doi.org/10.1145/2968452
- https://dx.doi.org/10.7717/peerj-cs.147
- https://dx.doi.org/10.1126/science.1213847
- https://dx.doi.org/10.1073/pnas.1708290115
- https://dx.doi.org/10.1038/s41597-021-00981-0
- https://dx.doi.org/10.1038/srep01376
- https://dx.doi.org/10.1093/joc/jqab029
- https://dx.doi.org/10.1080/10584609.2020.1744780
- https://dx.doi.org/10.1177/09567976221140828
- https://dx.doi.org/10.1080/10584609.2022.2155758
- https://dx.doi.org/10.1098/rsos.180448
- https://dx.doi.org/10.1080/1369118X.2019.1646300
- https://dx.doi.org/10.1080/1369118X.2019.1637447
- https://dx.doi.org/10.1080/10584609.2018.1477506
- https://doi.org/10.1145/2872518.2889302
- https://dx.doi.org/10.1371/journal.pone.0241045
- https://dx.doi.org/10.1080/19312458.2020.1812555
- https://dx.doi.org/10.1080/19312458.2023.2181319
- https://github.com/tatsu-lab/stanford_alpaca
- https://repository.essex.ac.uk/17679/1/compsocsci.pdf
- https://socialsciences.nature.com/posts/54262-computational-social-science-heralds-the-age-of-interdisciplinary-science/
- https://dx.doi.org/10.1109/SECSE.2009.5069155
- https://dx.doi.org/10.1109/SANER.2018.8330263
- https://dx.doi.org/10.1371/journal.pone.0286761
- https://dx.doi.org/10.21105/joss.00774
- https://dx.doi.org/10.1371/journal.pcbi.1003285
- https://dx.doi.org/10.1038/s41597-022-01143-6
- https://doi.org/10.1093/comjnl/27.2.97
- https://dx.doi.org/10.18637/jss.v046.i03
- https://dx.doi.org/10.1371/journal.pcbi.1008316
- https://dx.doi.org/10.21105/joss.01603