Bilal Piot

新しい方法がリアルタイムフィードバックを使ってAIの調整を改善する。

2025-09-10T04:02:48+00:00 ― 1 分で読む

研究は、言語モデルをより安全でユーザーにとって便利にすることを目指している。

2025-08-21T06:36:48+00:00 ― 1 分で読む

Gemma 2は、言語タスクにおいてコンパクトなサイズで高性能を発揮するよ。

2025-07-04T12:59:30+00:00 ― 1 分で読む

報酬モデルのトレーニングに新しいアプローチを取り入れることで、AIが人間の好みにより合った形になるんだ。

2025-06-09T16:00:54+00:00 ― 1 分で読む