LLMと事実の想起評価LLMと事実の想起評価研究。LLMの事実を安全に記憶する能力に関する計算と言語大きな言語モデルにおける事実の再現性の評価LLMが事実情報をどれくらい覚えてるかと、その要因についての評価。2025-08-16T20:45:48+00:00 ― 1 分で読む
長文QAシステムの改善長文QAシステムの改善ることを目指してるよ。新しいデータセットは質問応答の効果を高め計算と言語ロバストQAで長文質問応答を進化させる人が作った長い回答を使って質問応答のパフォーマンスを向上させるための新しいデータセット。2025-07-11T09:50:18+00:00 ― 1 分で読む