Um novo benchmark revela lacunas na compreensão visual de grandes modelos de linguagem.
― 8 min ler
Ciência de ponta explicada de forma simples
Um novo benchmark revela lacunas na compreensão visual de grandes modelos de linguagem.
― 8 min ler
Incluir dados em outras línguas melhora o desempenho do modelo de visão-linguagem e a compreensão cultural.
― 7 min ler
Um novo método melhora a forma como modelos de IA interpretam relações espaciais e temporais.
― 6 min ler
Pesquisadores transformam vídeos comuns em cenas 3D imersivas usando tecnologia de IA.
― 8 min ler