LongGenBench:LongGenBench:LLMのテキストスキルをテスト中トを生成する言語モデルを評価する。新しいベンチマークが長くて一貫したテキス計算と言語LLMでの長文生成の評価LongGenBenchは、大規模言語モデルが高品質な長文を生成する能力を評価する。Yuhao Wu, Ming Shan Hee, Zhiqing HuJun 17, 2025 ― 1 分で読む