Kaijie Zhu

Um novo método equilibra a robustez do modelo e a generalização contra entradas complicadas.

2025-10-13T16:16:00+00:00 ― 6 min ler

Apresentando uma nova forma de avaliar modelos de linguagem grandes de maneira eficaz.

2025-09-05T09:14:00+00:00 ― 7 min ler

NPHardEval4V avalia as capacidades de raciocínio de modelos de linguagem multimodais grandes.

2025-09-01T13:19:48+00:00 ― 9 min ler

Esse estudo analisa como os LLMs lidam com raciocínio em cenários abstratos e contextuais.

2025-08-02T16:24:18+00:00 ― 6 min ler

Analisando os problemas e as possíveis melhorias na revisão por pares acadêmica.

2025-07-27T05:49:42+00:00 ― 9 min ler