Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Sebastian Krause

計算と言語合成データで報酬モデルを改善する

合成嗜好データを生成する新しい方法が、強化学習における報酬モデルを強化する。

2025-09-15T07:33:00+00:00 ― 1 分で読む

計算と言語 Gemma 2を紹介するよ：新しい言語モデルだよ。

Gemma 2は、言語タスクにおいてコンパクトなサイズで高性能を発揮するよ。

2025-07-04T12:59:30+00:00 ― 1 分で読む