Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Nagarajan Natarajan

機械学習ロバストDPOで言語モデルを改善する

ノイズの多い人間のフィードバックにもかかわらず、言語モデルを強化する新しい方法。

2025-09-02T08:49:00+00:00 ― 1 分で読む

情報検索より良い検索結果のためのランキングシステムの改善

アイテムのランキングを新しい方法で行うと、検索やおすすめの精度がアップするよ。

2025-06-11T19:45:36+00:00 ― 1 分で読む