Zilong Zheng

O MindDial melhora as conversas com IA ao levar em conta as crenças e perspectivas de cada um.

2025-10-26T19:04:54+00:00 ― 6 min ler

O MathBench avalia as habilidades matemáticas dos LLMs em diferentes estágios educacionais.

2025-08-09T21:32:48+00:00 ― 6 min ler

O DiveR-CT melhora o red teaming automatizado pra avaliações de segurança mais eficazes.

2025-08-05T02:44:00+00:00 ― 8 min ler

Uma nova abordagem melhora os modelos Transformer para lidar melhor com textos longos.

2025-07-24T22:15:54+00:00 ― 7 min ler

Novo benchmark avalia como modelos de vídeo-linguagem lidam com imprecisões de forma eficaz.

2025-07-24T17:47:18+00:00 ― 8 min ler

Um novo método ajuda os robôs a navegar e se orientar direitinho para as tarefas.

2025-07-14T07:05:42+00:00 ― 8 min ler

Esse método melhora o raciocínio visual ao implementar uma verificação em cada etapa do raciocínio.

2025-07-02T15:49:48+00:00 ― 8 min ler

Uma estrutura que usa tokens de memória melhora a compreensão e interação com vídeos.

2025-06-18T08:10:48+00:00 ― 8 min ler