Apresentando o MemSim, uma ferramenta pra avaliar a eficácia da memória em assistentes de modelos de linguagem.
Zeyu Zhang, Quanyu Dai, Luyu Chen
― 6 min ler
Ciência de ponta explicada de forma simples
Apresentando o MemSim, uma ferramenta pra avaliar a eficácia da memória em assistentes de modelos de linguagem.
Zeyu Zhang, Quanyu Dai, Luyu Chen
― 6 min ler
TrendSim simula tendências de redes sociais pra estudar os efeitos da desinformação.
Zeyu Zhang, Jianxun Lian, Chen Ma
― 8 min ler
Novo benchmark OmniEval melhora a avaliação de sistemas RAG em finanças.
Shuting Wang, Jiejun Tan, Zhicheng Dou
― 9 min ler