より良いAIモデルのためのより良いAIモデルのためのソフトラベルにもっと合うようになったよ。新しいアプローチで言語モデルが人間の好み機械学習ソフトな好みラベルが言語モデルのトレーニングを改善するソフトな優先ラベルは、モデルと人間の選択をより一致させる。2025-06-14T10:33:54+00:00 ― 1 分で読む