LLM評価の基盤作りLLM評価の基盤作り改善する。実世界の条件下で大規模言語モデルの評価を計算と言語変わりゆく世界での大規模言語モデルの評価LLMが新しい情報やバイアスにどう適応するかを評価する。2025-08-11T02:46:36+00:00 ― 1 分で読む