研究の基盤: インフラエンジニアリング
科学研究におけるインフラエンジニアの重要な役割を強調する。
― 1 分で読む
目次
研究はますますソフトウェアに依存するようになってきて、バイオインフォマティクス、機械学習、物理学などの分野での進歩を推進してる。特に研究に焦点を当てているソフトウェアエンジニアは重要な役割を果たしているけど、インフラエンジニアの重要性はあまり注目されないことが多い。インフラエンジニアは、コンパイラやワークフローマネージャーなど、研究ソフトウェアを支える基盤システムに取り組んでいる。この文章では、インフラエンジニアリングの重要性と、その専門家が不足していることによる科学コミュニティの課題に焦点を当てるよ。
研究におけるソフトウェアの重要性
今やソフトウェアは様々な分野での研究に欠かせないものになってる。データ分析やシミュレーション、実験を行うために使われることもある。昔は研究者自身がこのソフトウェアを開発してたけど、最近ではリサーチソフトウェアエンジニア(RSE)っていう新しい役割が出てきた。RSEは研究者と密接に協力して、科学的な作業をサポートするソフトウェアを作ってる。この役割のおかげで科学ソフトウェアの質が向上したけど、出版などの短期的な成果に焦点を当てることで、研究インフラの長期的な計画や革新が損なわれることもある。
インフラエンジニアリングの課題
インフラエンジニアリングは、研究者が依存するソフトウェアツールやシステムの管理と改善を含む裏方の役割だから、これが見落とされがち。研究者が問題に直面すると、持続可能な解決策を考えるんじゃなくて、急いで短期的な修正を探しがち。この即応的なアプローチは、研究のワークフローに複雑さをもたらし、科学者たちが一貫した結果を得るのが難しくなる。
クラウドコンピューティングの経済的状況
クラウドコンピューティングの普及は、研究の進め方を変えてしまった。クラウドサービスは処理やストレージのための広大なリソースを提供し、研究の新しいモデルを生み出してる。でも、この変化は伝統的なハイパフォーマンスコンピューティング(HPC)センターとクラウドコンピューティングプロバイダーの間に亀裂を生じさせた。HPCセンターは通常保守的なアプローチをとる一方、クラウドプロバイダーは実験や革新の自由があることが多い。この違いが、両者のコラボレーションを難しくしてるんだよね。
HPCとクラウドコンピューティングの協力の必要性
効率や効果を最大化するためには、HPCプロバイダーとクラウドコンピューティング企業の間の協力が不可欠。両者には、科学コミュニティに利益をもたらす独自の強みやリソースがあるからさ。知識を共有し、一緒に取り組むことで、現在の研究の課題に対処できる。例えば、クラウドコンピューティングはデータ管理のための高度なツールを提供できるし、HPCは複雑な分析に必要な計算力を提供できる。
協力の文化を作る
HPCとクラウドコンピューティングの間の成功するパートナーシップには、協力の文化が必要。これには、定期的なコミュニケーションやリソースの共有、共通の目標に焦点を当てることが含まれる。異なるコミュニティが集まることで、課題により効果的に取り組める。インフラエンジニアはこのプロセスで重要な役割を果たしていて、二つの分野のギャップを埋め、より良いコラボレーションを促進するのを助けてる。
インフラエンジニアの役割
インフラエンジニアは研究を支えるシステムやツールの責任を担ってる。彼らはソフトウェアとハードウェアがスムーズに動くようにして、研究者が科学的な探求に集中できるようにしている。でも、これらのエンジニアはしばしば裏方で働いているため、彼らの貢献は認識されないことが多い。この見落としは、科学研究全体の効率や進展に影響を与える可能性がある。
インフラエンジニアリングの実例
実際の例を挙げると、インフラエンジニアリングが研究においてどれだけ重要かが分かる。例えば、コンテナ技術は研究者がソフトウェアとその依存関係を異なるシステムで簡単に実行できるようにパッケージ化するのを可能にする。このアプローチは可搬性を向上させ、技術的問題のトラブルシューティングにかかる時間を減らす。また、複雑な分析やデータ処理タスクを管理するためのワークフローツールもある。
研究のニーズとインフラ開発の乖離
大きな問題の一つは、研究者のニーズと利用できるツールとの間に乖離があること。インフラエンジニアは、研究者が直面している特定の課題を理解しないと、効果的な解決策を開発できない。たとえどんなに良いツールでも、この理解がなければ科学コミュニティのニーズに応えられないことも。インフラの専門家と研究者の間で定期的なコミュニケーションをとることが、このギャップを埋めるのには不可欠。
再現性危機への対処
再現性は科学研究の重要な側面だけど、達成するのはしばしば難しい。ソフトウェアの更新、データソースの変更、ハードウェアの違いなどが、結果の再現能力に影響を与える。インフラエンジニアは、ソフトウェアやデータの変更を追跡するシステムを開発することで再現性を向上させる役割を果たせる。この情報は、研究者が自分の結果がどのような条件下で得られたかを理解するのを助け、複製を促進する。
持続可能なプラクティスの重要性
インフラエンジニアリングにおける持続可能性は、研究の長期的な成功にとって重要だよ。これには、ソフトウェアプロジェクトが必要に応じて維持され、更新されることを確保することも含まれる。多くのソフトウェアプロジェクトは公開されたりすると、活動が急激に減ることがよくあり、それが古くなったツールやシステムに繋がる。インフラエンジニアは、持続可能なプラクティスを提唱し、継続的なサポートや開発のための資金を確保することでこれを防ぐ手助けができる。
研究インフラの未来
これからのことを考えると、インフラエンジニアの役割は、技術や研究方法の変化とともに進化し続けるだろう。科学コミュニティが新しいツールや技術を受け入れるにつれて、インフラエンジニアはそれに合わせて適応し、革新していく必要がある。これには、新たな技術の探求、新しいスタンダードの開発、研究慣行の変化を促進することが含まれる。
インフラエンジニアにとっての支援的環境作り
イノベーションと効果を高めるためには、インフラエンジニアにとっての支援的環境を作ることが重要。これには、必要なリソースや資金、協力の機会を提供することが含まれる。この役割を優先することで、研究機関は全体的な成功を向上させ、科学の進展を促進できる。
結論
インフラエンジニアは科学研究を支える上で不可欠な役割を果たしている。彼らの仕事は常に目に見えるわけじゃないけど、研究プロジェクトの成功には欠かせないんだ。異なるコミュニティ間のコラボレーションを促進し、持続可能なプラクティスに投資し、インフラエンジニアのニーズを優先することで、科学コミュニティはイノベーションや成功の向上ができる。これからも、インフラエンジニアの貴重な貢献を認識し、支援していくことが研究の進展を確保するために重要になる。
タイトル: Infrastructure Engineering: A Still Missing, Undervalued Role in the Research Ecosystem
概要: Research has become increasingly reliant on software, serving as the driving force behind bioinformatics, high performance computing, physics, machine learning and artificial intelligence, to name a few. While substantial progress has been made in advocating for the research software engineer, a kind of software engineer that typically works directly on software and associated assets that go into research, little attention has been placed on the workforce behind research infrastructure and innovation, namely compilers and compatibility tool development, orchestration and scheduling infrastructure, developer environments, container technologies, and workflow managers. As economic incentives are moving toward different models of cloud computing and innovating is required to develop new paradigms that represent the best of both worlds, an effort called "converged computing," the need for such a role is not just ideal, but essential for the continued success of science. While scattered staff in non-traditional roles have found time to work on some facets of this space, the lack of a larger workforce and incentive to support it has led to the scientific community falling behind. In this article we will highlight the importance of this missing layer, providing examples of how a missing role of infrastructure engineer has led to inefficiencies in the interoperability, portability, and reproducibility of science. We suggest that an inability to allocate, provide resources for, and sustain individuals to work explicitly on these technologies could lead to possible futures that are sub-optimal for the continued success of our scientific communities.
著者: Vanessa Sochat
最終更新: 2024-05-28 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2405.10473
ソースPDF: https://arxiv.org/pdf/2405.10473
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://us-rse.org/join/
- https://docs.google.com/spreadsheets/d/1cxUqCms4TNf64Go5eNBgpJ4Z0pzwJz2XkBF3paht9Rg/edit?usp=sharing
- https://events.linuxfoundation.org/kubecon-cloudnativecon-north-america/
- https://supercomputing.org/
- https://www.computer.org/csdl/journal/ts/write-for-us/15090?title=Author%20Information&periodical=IEEE%20Transactions%20on%20Software%20Engineering
- https://dl.acm.org/ccs.cfm
- https://www.acm.org/publications/proceedings-template
- https://capitalizemytitle.com/
- https://www.acm.org/publications/class-2012
- https://dl.acm.org/ccs/ccs.cfm
- https://ctan.org/pkg/booktabs
- https://goo.gl/VLCRBB
- https://www.acm.org/publications/taps/describing-figures/