人間のフィードバックでAI人間のフィードバックでAIを強化する語モデルを向上させてるんだ。新しい方法がトレーニング信号を改善して言計算と言語人間の好みに合わせた言語モデルの調整新しいアプローチが、人間の価値観をもっと理解することで言語モデルのトレーニングを向上させる。2025-06-26T05:23:06+00:00 ― 1 分で読む