Yueqian Wang

O STAIR melhora a resposta a perguntas em vídeos dividindo as perguntas em tarefas mais fáceis de lidar.

2025-09-18T09:48:36+00:00 ― 7 min ler

HawkEye melhora modelos de vídeo-texto pra processar vídeos mais longos de forma eficaz.

2025-08-28T23:52:42+00:00 ― 6 min ler

Novo benchmark avalia como modelos de vídeo-linguagem lidam com imprecisões de forma eficaz.

2025-07-24T17:47:18+00:00 ― 8 min ler

Um novo modelo permite interação em tempo real com vídeos, melhorando a compreensão e o engajamento.

2025-05-07T14:13:20+00:00 ― 5 min ler

Pesquisas mostram como a gente pode fazer as máquinas entenderem diálogos complexos.

2025-01-29T03:16:12+00:00 ― 7 min ler