LLMと思考の連鎖分析LLMと思考の連鎖分析言語モデルの推論の矛盾を探る。計算と言語思考の連鎖がLLMの推論にどう影響するかを調べる大規模言語モデルの性能に対する推論方法の影響を分析する。2025-09-04T08:52:30+00:00 ― 1 分で読む
長文の理解を評価する長文の理解を評価するを評価すること。長い物語や複雑な質問に対するLLMの能力計算と言語NovelQA: 長文理解の新しいベンチマーク文学における長文を処理する能力でLLMを評価する。2025-08-28T03:12:24+00:00 ― 1 分で読む
RAGシステム評価フレームRAGシステム評価フレームワークい方法。RAGシステムのパフォーマンス評価の新し計算と言語リトリーバル拡張生成システムの評価RAGシステムのパフォーマンスを評価するための新しいフレームワーク。2025-06-27T07:51:00+00:00 ― 1 分で読む
言語モデルのトレーニングを言語モデルのトレーニングを革新する上させる。新しい方法がLLMの指示に従うスキルを向計算と言語大規模言語モデルの改善:新しいフレームワーク言語モデルの指示に従う能力を高める新しいアプローチ。2025-02-28T18:21:36+00:00 ― 1 分で読む