実世界のデータでLLMを評実世界のデータでLLMを評価するよ。を活用して評価をもっとわかりやすくしてる新しいベンチマークは、コミュニティの意見機械学習言語モデルを評価するための動的ベンチマークリアルなデータストリームを使って言語モデルを評価する新しいシステム。2025-08-02T01:23:42+00:00 ― 1 分で読む
AIの言語バイアスを調べたAIの言語バイアスを調べたよらかにした。研究が言語モデルにおける性別バイアスを明計算と言語大規模言語モデルの言語バイアスAIモデルのバイアスを通じて、言語がジェンダー観にどう影響するかを調べる。2025-07-14T17:45:36+00:00 ― 1 分で読む
ラベルなしの形状マッチングラベルなしの形状マッチング新しい技術で画像分析の手作業が減ったよ。コンピュータビジョンとパターン認識ラベルなしで画像の効率的な形状マッチング手動ラベルなしで画像内の形をマッチングする新しい方法。2025-07-06T14:37:48+00:00 ― 1 分で読む