Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Rongxiang Weng

計算と言語人間の価値に合わせた言語モデルの調整

安全なAIシステムのための強化学習技術を探求中。

2025-10-21T22:57:06+00:00 ― 1 分で読む

機械学習 LD-DPOを使った言語モデルの冗長性削減

言語モデルを簡潔で効果的にする新しいアプローチ。

2025-06-14T04:54:12+00:00 ― 1 分で読む