Simple Science

最先端の科学をわかりやすく解説

# コンピューターサイエンス# 機械学習# 人工知能

会議論文準備の基本ガイドライン

カンファレンス論文を効果的に準備して提出するための重要なステップ。

Julia Buhmann, Ward Haddadin, Lukáš Pravda, Alan Bilsland, Hagen Triendl

― 1 分で読む


学会論文の書き方ガイド学会論文の書き方ガイド重要な論文執筆の戦略を簡潔にまとめたもの
目次

会議のための論文を書くときは、その論文がどんな貢献をしているのか、主張を含めて明確にすることが重要だよ。冒頭の要約やイントロでは、主なポイントを伝えるべき。もし論文の主張が要約と合わないと、レビューアには好印象を持たれないかも。

論文には重要な制約や研究の前提となる仮定も含めるべきだよ。例えば、データが完全に正確だという仮定に基づいているなら、それを明記する必要がある。これらの仮定が満たされない場合、結果がどう変わるかも指摘しておくといいね。さらに、研究者は主張の広さについても考えるべきだよ。結果が数回のテストに基づいているなら、そのことも言わなきゃ。

結果に影響を与える要因についても言及することが大事だよ。例えば、顔認識システムが低照度の環境でうまく機能しないなら、それを記載しよう。論文では、提案した方法が一般的にどれくらいうまく機能するか、例えば大きなデータセットに対して効率的かどうかを議論する必要があるね。

研究者は自分たちの方法について、プライバシーや公平性についても考慮すべきだよ。制約を隠すよりも正直に話す方がいい。レビューアは、短所を率直に伝えたからといって論文にペナルティを与えないはずだから、その正直さは研究コミュニティの信頼を維持するのに役立つんだ。

理論、仮定、証明

論文に理論的な結果がある場合、定理や証明は番号を付けて簡単に参照できるようにするべきだよ。これらの定理に適用される仮定は、定理自体か他の場所で明確に述べる必要がある。証明はメインの論文に含めるか、補足資料にすることもできるけど、補足資料にだけ出てくる場合は、主要なアイデアを把握するための簡単な概要を提供すべきだね。

メインの論文に含まれる非公式な証明は、付録や補足資料にある正式な証明で裏付けられるべきだよ。定理と補題は、依存している証明を参照するべきだね。

実験結果と再現性

論文に実験が含まれている場合、他の研究者がその結果をどう再現できるかを明確にしなきゃいけないよ。これは、方法を完全に説明するか、コードやデータへのアクセスを提供することを意味するかもしれない。目標は、研究者がその発見を確認したり再現したりできるようにすることで、コードをリリースしたり、詳細な指示を提供したり、モデルへのアクセスを提供する方法が考えられるね。

コードのリリースは必須ではないけど、強く推奨されているよ。研究者は結果を再現するために必要な手順や環境を正確に提供するべきだよ。コードを共有しない場合でも、データへのアクセス方法や必要な準備を詳細に説明しなければならないんだ。

研究者は実験のセットアップについても言及し、結果を理解できるだけの詳細が含まれていることを確認する必要があるよ。誤差棒や信頼区間などの変数を提示して、発見の信頼性を反映することが求められるんだ。これらがどう計算されたかと、その背後にある仮定、例えば誤差が正規分布しているかどうかも説明する必要があるね。

計算リソース

実験を含む論文は、使用したコンピューティングリソースの種類、例えばCPU、GPU、クラウドサービスを利用したかどうかを詳細に記載する必要があるよ。それぞれの実験に必要なリソースを共有し、使用したトータルのリソースを推定することが重要だね。また、論文に載せられなかった実験に追加のコンピュータリソースを使用した場合は、それも開示すべきだよ。

倫理規範

提出前に、著者は会議の倫理規範を確認するべきだよ。これらの倫理ガイドラインに従わない理由がある場合は、特定の情報を明らかにせずに論文で説明する必要があるんだ。

社会的影響

研究者は自分たちの研究の社会的な影響についても考慮しなきゃいけないよ。技術の誤用など、潜在的にネガティブな影響がある場合は、それを説明する必要がある。プライバシー、公平性、安全性に関する懸念の例も含めるといいね。著者は、自分たちの研究が意図した通りに使われた場合と、うまく機能しなかった場合の両方で、どのように害を及ぼす可能性があるかを認識する必要があるんだ。

リスクが関わっている場合は、それを最小限に抑える方法を提案するのが役立つよ。たとえば、モデルへのアクセスを制限したり、誤用を監視したり、技術が責任を持って使用されるようにすることが考えられるね。

既存資産のライセンス

研究が既存のデータセットやコードを使用する場合、そのソースを明確に引用するべきだよ。使用したバージョンを示し、利用可能な場合はURLも提供する必要があるんだ。それぞれの資産のライセンス情報や著作権の詳細も含めるべきだね。もしデータがインターネットから集められた場合、研究者はそのソースの利用規約を概説する必要があるよ。

新しい資産

論文が新しいデータセットやモデルを紹介する場合、それらについての詳細を含めるべきだよ。データがどう集められたか、ライセンス、制約などが含まれるかもしれない。著者は、プロジェクトに関与した個人から同意が得られたかどうか、またその方法についても明確にする必要があるんだ。提出時には、個人の身元を保護するためにデータ資産を匿名化することも必要だよ。

クラウドソーシングと人間の被験者

クラウドソーシングや人間の被験者を含む研究では、論文にプロセスに関する詳細情報を含めるべきだよ。研究者は、関与したすべての作業者が公正に報酬を受け取ることを確認することが奨励されるね。人間の被験者が研究に参加した場合、レビュー委員会から適切な承認を得ることが重要で、これを明確に記載する必要があるんだ。

結論

要するに、NeurIPS会議のために論文を準備する際は、明確で徹底的であることが重要だよ。論文には意味ある貢献を含め、制約に対処し、社会的影響を議論する必要があるんだ。実験方法の明確さとリソースや倫理的考慮事項の詳細な文書化が、研究を強化し、科学コミュニティの透明性を維持する助けになるだろう。完全な情報を提供することで、研究者は信頼を促進し、さらなる調査を奨励することができるんだ。

オリジナルソース

タイトル: Improving generalisability of 3D binding affinity models in low data regimes

概要: Predicting protein-ligand binding affinity is an essential part of computer-aided drug design. However, generalisable and performant global binding affinity models remain elusive, particularly in low data regimes. Despite the evolution of model architectures, current benchmarks are not well-suited to probe the generalisability of 3D binding affinity models. Furthermore, 3D global architectures such as GNNs have not lived up to performance expectations. To investigate these issues, we introduce a novel split of the PDBBind dataset, minimizing similarity leakage between train and test sets and allowing for a fair and direct comparison between various model architectures. On this low similarity split, we demonstrate that, in general, 3D global models are superior to protein-specific local models in low data regimes. We also demonstrate that the performance of GNNs benefits from three novel contributions: supervised pre-training via quantum mechanical data, unsupervised pre-training via small molecule diffusion, and explicitly modeling hydrogen atoms in the input graph. We believe that this work introduces promising new approaches to unlock the potential of GNN architectures for binding affinity modelling.

著者: Julia Buhmann, Ward Haddadin, Lukáš Pravda, Alan Bilsland, Hagen Triendl

最終更新: 2024-09-19 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2409.12995

ソースPDF: https://arxiv.org/pdf/2409.12995

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

類似の記事