Novo método melhora a legendagem de vídeos usando modelos de imagem-linguagem.
― 8 min ler
Ciência de ponta explicada de forma simples
Novo método melhora a legendagem de vídeos usando modelos de imagem-linguagem.
― 8 min ler
O VideoPrism ajuda a interpretar e analisar conteúdo de vídeo de maneira eficaz.
― 6 min ler
Pesquisas mostram como patches de gatilho influenciam a geração de imagens em modelos de difusão.
― 7 min ler
Uma nova abordagem pra melhorar os prompts dos modelos de texto pra imagem e ter resultados melhores.
― 6 min ler
O SOAR melhora a precisão do reconhecimento de ações na análise de vídeos de drones.
― 6 min ler
Apresentando Autoencoders Máscara de Vídeo Longo pra uma melhor compreensão de vídeo.
― 7 min ler
HypDAE muda a maneira como a gente cria imagens a partir de exemplos mínimos.
― 7 min ler
O dataset DAVE captura cenários de estrada complexos pra treinar melhor a IA.
― 9 min ler