Alex Beutel

この記事では、ユーザーのネガティブフィードバックを使ってレコメンデーションシステムを強化する方法について話してるよ。

2025-10-05T06:56:54+00:00 ― 0 分で読む

新しい方法がAIの訓練を安全性と有用性を高める。

2025-06-02T01:47:18+00:00 ― 1 分で読む

熟慮的アラインメントは、AI言語モデルをもっと安全で信頼できるものにすることを目指してるよ。

2025-02-09T22:33:09+00:00 ― 1 分で読む

自動化されたレッドチームがどんな風にAIのセキュリティを強化するのか、クリエイティブな挑戦を通じて発見しよう。

2025-01-28T13:37:39+00:00 ― 1 分で読む