QUENCHを使ってLLM QUENCHを使ってLLM を評価する ベンチマーク。 機械的推論における文化的ギャップを埋める 計算と言語 クエンチ:文化的文脈を通じた機械的推論の再考 異文化の背景におけるLLMの推論をテストするための新しいベンチマーク。 Mohammad Aflah Khan, Neemesh Yadav, Sarah Masud Mar 1, 2025 ― 1 分で読む