O MUSE melhora a precisão da busca de vídeos através do aprendizado de características em múltiplas escalas.
― 6 min ler
Ciência de ponta explicada de forma simples
O MUSE melhora a precisão da busca de vídeos através do aprendizado de características em múltiplas escalas.
― 6 min ler
O ControlCol melhora o controle do usuário na colorização automática de vídeos.
― 7 min ler
Esse método permite que os usuários controlem as ações do vídeo usando ferramentas simples.
― 7 min ler
Um novo método melhora a geração de vídeos usando duas imagens fixas para transições suaves.
― 7 min ler
Pesquisas revelam abordagens inovadoras para restaurar vídeos com borrão de movimento usando câmeras de evento.
― 5 min ler
Um novo sistema melhora a qualidade de vídeo em baixa luz e reduz o desfoque usando câmeras de evento.
― 8 min ler
Kangaroo melhora a análise de vídeo integrando visuais, sons e texto de forma eficaz.
― 6 min ler
Um novo método melhora a qualidade e a eficiência da geração de vídeos.
― 7 min ler
Um método novo melhora como a gente processa vídeos longos.
― 6 min ler
Sistemas HAR melhoram a segurança ao detectar comportamentos estranhos em tempo real.
― 5 min ler
Um novo método combina 2D e 3D pra vídeos realistas de humanos.
― 7 min ler
Uma nova abordagem melhora o alinhamento de vídeos em grandes conjuntos de dados.
― 11 min ler
O MRDAC melhora a qualidade do vídeo facial e a compressão usando múltiplos quadros de referência.
― 7 min ler
Um novo método para estimar a profundidade com precisão a partir de sequências de vídeo.
― 6 min ler
Uma nova estrutura conta as ações em vídeos com várias pessoas de forma precisa.
― 7 min ler
Um novo método melhora a classificação de vídeos otimizando a escolha dos quadros.
― 9 min ler
O Video-XL processa vídeos longos de forma eficiente, melhorando a precisão e o desempenho.
― 7 min ler
Times competem pra melhorar os métodos de previsão de atenção em vídeos.
― 6 min ler
Novos métodos melhoram a precisão da sumarização de vídeos enquanto reduzem os custos computacionais.
― 7 min ler
Uma nova abordagem usa ressonância magnética em tempo real pra visualizar os movimentos da produção da fala.
― 6 min ler
Esse novo método facilita a geração de imagens em modelos de IA, melhorando a eficiência e a velocidade.
― 7 min ler
Novos métodos aceleram a codificação e decodificação de vídeo.
― 6 min ler
O VideoGLaMM melhora a compreensão de vídeos através de conexões visuais e textuais detalhadas.
― 7 min ler
O SPECTRUM melhora as legendas dos vídeos ao integrar emoções e contexto pra uma experiência melhor pra quem assiste.
― 6 min ler
O EVQAScore melhora a avaliação de QA em vídeo de um jeito eficiente e eficaz.
― 7 min ler
Novas métricas melhoram a avaliação da qualidade de vídeo para tarefas de reconhecimento por máquinas.
― 9 min ler
Aprenda como o 4D Gaussian Splatting transforma vídeos comuns em experiências 3D.
― 7 min ler
Estudo melhora a compreensão de vídeos com perguntas focadas em movimento e respostas visuais.
― 7 min ler
A Tangi transforma vídeo 360° em artefatos tangíveis pra colaboração em design.
― 8 min ler
Um desafio pra melhorar a qualidade de streaming de vídeos em 360 graus.
― 5 min ler
A VAMP oferece uma nova abordagem pra avaliar a qualidade de vídeo além das métricas atuais.
― 7 min ler
Apresentando Autoencoders Máscara de Vídeo Longo pra uma melhor compreensão de vídeo.
― 7 min ler
Uma nova abordagem pra melhorar o rastreamento de câmeras em cenas de vídeo com movimento rápido.
― 5 min ler
Usando outpainting generativo pra aumentar a lembrança e o engajamento dos vídeos.
― 7 min ler
Um novo método melhora a qualidade da imagem para visualizações digitais.
― 6 min ler
O VidHal mede a capacidade dos modelos de vídeo em interpretar o conteúdo com precisão.
― 7 min ler
Aprenda como vídeos sintéticos ajudam os computadores a reconhecer ações.
― 6 min ler
Um método pra localizar partes específicas de vídeo usando parágrafos de texto.
― 5 min ler
Um novo método pra criar vídeos que preservam a identidade e melhoram a qualidade visual.
― 6 min ler
Gere vídeos de alta qualidade rapidinho só com algumas palavras usando o Open-Sora Plan.
― 6 min ler