Bertie Vidgen

新しいテストスイートが言語モデルの安全性行動を評価する。

2025-10-13T08:22:00+00:00 ― 1 分で読む

LLMの安全性向上に焦点を当てたデータセットのレビュー。

2025-08-21T08:04:18+00:00 ― 1 分で読む

さまざまな分野での生成AI技術の責任ある使い方を探る。

2025-08-16T14:18:42+00:00 ― 1 分で読む

WorkBenchは、ユニークな評価方法を使ってエージェントの現実的なオフィス作業をこなす能力をテストするんだ。

2025-08-14T22:09:12+00:00 ― 1 分で読む

オープンソースの生成AI技術のリスクとチャンスを調べる。

2025-08-11T04:13:30+00:00 ― 1 分で読む

AIモデルを責任を持って、効果的に開発するためのベストプラクティスを学ぼう。

2025-07-24T22:08:00+00:00 ― 1 分で読む

自然言語のユニットテストは、言語モデルを評価するためのわかりやすい方法を提供するよ。

2025-02-25T02:53:15+00:00 ― 1 分で読む