LongGenBench:LongGenBench:LLMのテキストスキルをテスト中トを生成する言語モデルを評価する。新しいベンチマークが長くて一貫したテキス計算と言語LLMでの長文生成の評価LongGenBenchは、大規模言語モデルが高品質な長文を生成する能力を評価する。2025-06-17T21:54:36+00:00 ― 1 分で読む