Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Max Bartolo

計算と言語大規模言語モデルにおける人間のフィードバックの評価

言語モデルの出力を評価するための人間のフィードバックの信頼性を調べる。

2025-09-20T21:35:12+00:00 ― 1 分で読む

コンピュータと社会 AI画像における暗黙の脅威への対処

コミュニティ主導の取り組みで、T2Iモデルの有害なプロンプトを特定する。

2025-09-08T09:31:06+00:00 ― 1 分で読む

計算と言語合成批評で報酬モデルを向上させる

新しい方法が合成批評を使って報酬モデルを改善し、より良い整合性を実現する。

2025-08-03T23:12:54+00:00 ― 1 分で読む