Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

人間のフィードバックに関する最新の記事

機械学習人間のフィードバックを使って分布外学習を改善する

新しい方法は、人間の入力を取り入れて機械学習モデルのOOD学習を強化するんだ。

2025-06-18T23:05:24+00:00 ― 1 分で読む

計算と言語小さな言語モデルでAIの整合性を高める

弱い言語モデルを使うことで、AIの整合性を効率的に向上させることができるよ。

2025-06-12T10:46:12+00:00 ― 1 分で読む

計算と言語新しい報酬モデルでAIのアライメントを改善する

報酬モデルのトレーニングに新しいアプローチを取り入れることで、AIが人間の好みにより合った形になるんだ。

2025-06-09T16:00:54+00:00 ― 1 分で読む

機械学習オークションでAIのデータ収集を改善する

新しいオークションベースの方法が、AIモデル用の嗜好データ収集の効率を向上させる。

2025-06-06T16:19:36+00:00 ― 1 分で読む

ロボット工学 GRACEの紹介：社会に気づいたロボットへの一歩

GRACEは、ロボットが家や職場でタスクを行いながら社会的に行動できるように手助けするよ。

2025-06-05T18:55:36+00:00 ― 1 分で読む

人工知能人間のフィードバックで言語モデルの訓練を簡素化する

新しい方法が、自己生成されたフィードバックを使って言語モデルのトレーニングを強化する。

2025-06-04T15:08:42+00:00 ― 1 分で読む

機械学習テスト時適応で機械学習モデルを強化する

新しい見たことないデータに直面したとき、機械学習モデルがどうやって改善できるかを学ぼう。

2025-06-03T19:07:54+00:00 ― 1 分で読む

計算と言語言語モデルの評価：新しいアプローチ

自然言語のユニットテストは、言語モデルを評価するためのわかりやすい方法を提供するよ。

2025-02-25T02:53:15+00:00 ― 1 分で読む

計算と言語 iPrOp: 完璧なプロンプトのためのスマートアシスタント

iPrOpを使って、より良いAIの反応が得られるようにプロンプトを最適化しよう。

2025-02-22T13:53:51+00:00 ― 1 分で読む

機械学習キャリブレーテッド・ダイレクト・プレファレンス・オプティマイゼーション: AIの反応を形作る

人間の好みに合わせて言語モデルを効果的に調整する方法。

2025-02-21T13:01:12+00:00 ― 1 分で読む