Simple Science

最先端の科学をわかりやすく解説

# コンピューターサイエンス# デジタル・ライブラリー# 計算と言語

研究における引用慣行の衰退

研究者たちは古い研究を以前よりもあまり引用しなくなってきていて、これには大きな影響があるんだ。

― 1 分で読む


引用のトレンドが変わった引用のトレンドが変わったなるよ。古い研究を引用することが減るのはリスクに
目次

最近、研究者たちが過去の研究を引用する方法に明らかな変化が見られるようになった。多くの学問分野で、古い論文をあまり引用しない傾向があるんだ。この傾向を「引用年齢減少」と呼んでいて、いくつかの分野で心配なパターンを浮き彫りにしてる。

引用年齢減少って?

引用年齢減少は、研究者が古い研究を引用する傾向が減少していることを表してる。これは、経済学者が経済活動が減少している期間を定義するのと似てる。この傾向は特に自然言語処理(NLP)や機械学習(ML)などの分野で強く見られ、過去数年間で古い研究を参照することがかなり減ってる。

引用が大事な理由は?

引用は研究においていくつかの理由で重要なんだ。アイデアが過去の研究にどのように基づいているかを示したり、新しい発見にコンテキストを与えたり、先人たちの貢献を認めたりするから。古い文献とつながることで、研究者は過去の発見を確認したり、今の研究と歴史的なものを比較したり、最終的にはより豊かな知識の体系を作り出せるんだ。

さらに、研究者が過去の研究を引用する方法は、分野の価値観を示すことにもなる。例えば、古い研究を頻繁に引用する分野は基礎的な知識を重視してるかもしれないし、最近の研究ばかり引用する分野は歴史的な文脈よりも革新を重視してる可能性がある。

引用の忘却の問題

古い研究を引用しなくなる大きな原因の一つは「引用の忘却」と呼ばれる現象なんだ。これは、研究者が過去の関連する研究を引用しないことを指す。引用の忘却の原因は意図的な省略や忘れっぽさ、特に異なる分野の重要な研究を知らないことなど、いろいろある。

引用のパターンを調べる

引用のパターンが時間とともにどう変わるかを理解するために、研究者たちはさまざまな分野の膨大な数の学術論文を分析してきた。この分析は40年以上にわたって行われ、心理学やコンピュータサイエンスを含む多くの分野が古い文献との関わりを妨げていることを示してる。

古い研究を無視することの影響は深刻だ。アイデアの重複を招いたり、過去の失敗から学ぶ機会を逃すことにつながる。さらに、現在のトレンドが、将来の研究に役立つ貴重な洞察を覆い隠すバブルを作るリスクもある。

証拠

最近の分析で、NLPやMLを含むいくつかの分野で引用習慣が劇的に変わったことが明らかになった。例えば、2015年から2020年の間に、NLPの論文では引用年齢が約12.8%減少したんだ。他の分野も古い研究を引用する傾向が似てきてることが示唆されていて、この問題は広がっているかもしれない。

研究者たちは、最近の論文を引用する傾向が増えていることに気づいた。これは、出版数が増えていることを考慮しても変わらない傾向だ。このパターンは、研究者が幅広い文献にどれだけ積極的に関わっているのか疑問を投げかける。

異なる分野間の発見

異なる学問分野では引用のダイナミクスが異なる。歴史や哲学のような伝統的な分野は、確立された歴史のため古い研究を引用する傾向がある。一方、コンピュータサイエンスのような新しい分野は、最新の研究を引用することが多く、基礎的な文献よりも現在の発展に焦点を当ててる。

でも、医学は興味深いケースだ。長い歴史があるにもかかわらず、現代の研究を引用することが多い。これは、医療ジャーナルが許可される引用数を制限しているため、著者が最近の研究を優先する可能性があるからかもしれない。

出版数の影響

出版された論文の増加が引用のトレンドに影響を与えるかどうかが気になるところだ。一部の研究では、分野が急速に拡大しているときに、古い研究を犠牲にして最近の研究を引用する可能性が高まることが示唆されている。これを調べるために、研究者たちは出版数と引用の年齢の関係を評価してきた。

興味深いことに、論文の量を調整しても、引用年齢の低下の傾向には大きな変化が見られない。NLPを含むさまざまな分野で、古い引用の減少は続いていて、他の要因が関与していることを示している。

分野内外での引用

引用の年齢を見るだけでなく、研究者たちは異なる分野がどのように自分たちの歴史的文献に関わっているか、他の分野と比較しているかも調べた。多くの分野が自分の学問分野からの研究を引用することを好んでいて、最近の進展が古い基礎的研究よりも優先されるようなエコーチェンバーのような状況を示している。

数学や言語学のような一部の分野は、他の分野に比べて古い研究とのつながりを維持している傾向があり、学問的な遺産を尊重していることを示している。一方で、NLPやMLのような分野は、技術革新の速いペースのために最新の進展を優先しているかもしれない。

テクノロジーと研究文化の影響

NLPや関連分野での急速な発展は、この革新モデルの持続可能性について疑問を投げかけている。新しい技術が登場するにつれて、最近の発見に焦点を当てることが、以前の研究の重要な理解や検証を覆い隠すことにつながるかもしれない。

研究コミュニティが新しい発見を発表することを重視すると、視野が狭くなり、過去の貴重な洞察が sidelined される可能性がある。出版がキャリアの向上に結びついている学術環境のプレッシャーが、この問題を悪化させるかもしれない。

より良い引用実践のためのツール

引用の忘却の課題に対処するために、研究者たちは特定の論文の引用パターンを分析できるウェブベースのツールを開発している。これらのツールは引用の年齢や参照される分野の多様性を強調するのに役立ち、古い文献に関与する重要性への意識を高めることができる。

結論

多くの分野で引用年齢が減少している傾向は、科学的な議論の未来について重要な疑問を提起している。古い研究を引用することの減少は、知識の理解を狭め、過去の発見に基づく革新の機会を逃すことにつながる可能性がある。

学術コミュニティの一員として、研究者はこれらの傾向の方向性を形作る力を持ってる。より広範囲な文献、特に古い研究に意識的に関わることで、彼らは自分の研究を豊かにし、より包括的な科学的対話に貢献できる。

NLPやMLのような新しい分野での引用実践についてのこの継続的な会話は、学術研究の integrity と未来を定義する上で重要になるだろう。健全な研究文化を育むためには、過去の研究から学びつつ、現代の進展を受け入れることが不可欠だ。このバランスを通じて、科学コミュニティは革新を続け、責任を持ち、利用可能な知識の全範囲から情報を得ることができるんだ。

オリジナルソース

タイトル: Citation Amnesia: On The Recency Bias of NLP and Other Academic Fields

概要: This study examines the tendency to cite older work across 20 fields of study over 43 years (1980--2023). We put NLP's propensity to cite older work in the context of these 20 other fields to analyze whether NLP shows similar temporal citation patterns to these other fields over time or whether differences can be observed. Our analysis, based on a dataset of approximately 240 million papers, reveals a broader scientific trend: many fields have markedly declined in citing older works (e.g., psychology, computer science). We term this decline a 'citation age recession', analogous to how economists define periods of reduced economic activity. The trend is strongest in NLP and ML research (-12.8% and -5.5% in citation age from previous peaks). Our results suggest that citing more recent works is not directly driven by the growth in publication rates (-3.4% across fields; -5.2% in humanities; -5.5% in formal sciences) -- even when controlling for an increase in the volume of papers. Our findings raise questions about the scientific community's engagement with past literature, particularly for NLP, and the potential consequences of neglecting older but relevant research. The data and a demo showcasing our results are publicly available.

著者: Jan Philip Wahle, Terry Ruas, Mohamed Abdalla, Bela Gipp, Saif M. Mohammad

最終更新: 2024-12-13 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2402.12046

ソースPDF: https://arxiv.org/pdf/2402.12046

ライセンス: https://creativecommons.org/licenses/by-sa/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事