言語モデルと人気の質問言語モデルと人気の質問探る。人気が言語モデルの応答にどう影響するかを計算と言語言語モデルにおける人気質問の課題言語モデルは人気のある質問に苦労して、浅い答えや矛盾が生まれちゃうんだよね。2025-05-21T13:52:57+00:00 ― 1 分で読む
QUENCHを使ってLLMQUENCHを使ってLLMを評価するベンチマーク。機械的推論における文化的ギャップを埋める計算と言語クエンチ:文化的文脈を通じた機械的推論の再考異文化の背景におけるLLMの推論をテストするための新しいベンチマーク。2025-03-01T20:50:33+00:00 ― 1 分で読む