O STAIR melhora a resposta a perguntas em vídeos dividindo as perguntas em tarefas mais fáceis de lidar.
― 7 min ler
Ciência de ponta explicada de forma simples
O STAIR melhora a resposta a perguntas em vídeos dividindo as perguntas em tarefas mais fáceis de lidar.
― 7 min ler
HawkEye melhora modelos de vídeo-texto pra processar vídeos mais longos de forma eficaz.
― 6 min ler
Novo benchmark avalia como modelos de vídeo-linguagem lidam com imprecisões de forma eficaz.
― 8 min ler
Um novo modelo permite interação em tempo real com vídeos, melhorando a compreensão e o engajamento.
― 5 min ler
Pesquisas mostram como a gente pode fazer as máquinas entenderem diálogos complexos.
― 7 min ler