LLMの安全性向上に焦点を当てたデータセットのレビュー。
― 1 分で読む
最先端の科学をわかりやすく解説
LLMの安全性向上に焦点を当てたデータセットのレビュー。
― 1 分で読む
さまざまな分野での生成AI技術の責任ある使い方を探る。
― 1 分で読む
WorkBenchは、ユニークな評価方法を使ってエージェントの現実的なオフィス作業をこなす能力をテストするんだ。
― 1 分で読む
オープンソースの生成AI技術のリスクとチャンスを調べる。
― 1 分で読む
AIモデルを責任を持って、効果的に開発するためのベストプラクティスを学ぼう。
― 1 分で読む
自然言語のユニットテストは、言語モデルを評価するためのわかりやすい方法を提供するよ。
― 1 分で読む