Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Simeng Sun

計算と言語人間のフィードバックからの強化学習の進展

RLHFのリソースを減らしてモデルのパフォーマンスを上げる方法を探ってみて。

2025-09-25T22:03:42+00:00 ― 1 分で読む

計算と言語 AIモデルの長文生成の進展

新しいトレーニング方法で、言語モデルが詳しい長文を作る能力が向上してるよ。

2025-07-23T12:25:36+00:00 ― 1 分で読む