Um grande conjunto de dados de prompts e vídeos avança a tecnologia de texto para vídeo.
― 8 min ler
Ciência de ponta explicada de forma simples
Um grande conjunto de dados de prompts e vídeos avança a tecnologia de texto para vídeo.
― 8 min ler
Aprenda como mapas de saliência melhoram a geração de imagens e vídeos.
― 6 min ler
O SV3D cria visuais 3D incríveis a partir de imagens 2D únicas.
― 7 min ler
Crie vídeos com avatares falantes de forma fácil com o sistema inovador da Virbo.
― 8 min ler
Um novo modelo melhora a estimativa de profundidade combinando previsões e análise de múltiplos quadros.
― 6 min ler
Pesquisadores criam um conjunto de dados pra estudar como as pessoas aprendem imitando os outros.
― 9 min ler
Uma nova abordagem de IA tem como objetivo melhorar a velocidade e a eficiência na geração de imagens e vídeos.
― 5 min ler
Este estudo mostra como a mídia alimenta a desinformação online.
― 6 min ler
Um novo sistema facilita a edição de vídeo com descrições automatizadas.
― 7 min ler
O ExoDeepFinder detecta de forma eficiente eventos raros de exocitose em vídeos usando aprendizado profundo.
― 5 min ler
Este estudo analisa métodos de áudio para rastrear o movimento de pedestres em áreas urbanas.
― 8 min ler
GenMM melhora a inserção realista de objetos 3D em vídeos e scans de LiDAR.
― 7 min ler
Como o TikTok molda os hábitos dos usuários em relação ao vaping e à bebida.
― 6 min ler
Este artigo apresenta um método para gerar som preciso a partir de vídeos e texto.
― 8 min ler
Esse estudo propõe uma abordagem baseada em vídeo pra avaliar a gravidade do autismo em crianças.
― 7 min ler
Um conjunto de dados enorme pra melhorar a tecnologia e a pesquisa em linguagem de sinais.
― 6 min ler
Nova abordagem gera vídeos de ação humana de alta qualidade com informações de profundidade.
― 10 min ler
Pesquisadores desenvolveram PAV para criar avatares digitais realistas a partir de clipes de vídeo.
― 6 min ler
Um novo benchmark melhora a compreensão dos modelos sobre vídeos longos e linguagem.
― 6 min ler
Um novo conjunto de dados com pares de imagens de três tipos de câmeras para pesquisa em visão computacional.
― 6 min ler
Uma nova abordagem junta dados de áudio, vídeo e texto pra um diagnóstico de depressão mais eficaz.
― 9 min ler
Novo conjunto de dados traz informações sobre discurso de ódio em várias línguas e formatos.
― 7 min ler
Esse framework combina vídeos e dados do cérebro pra uma avaliação de dor melhor.
― 8 min ler
O SAM-2 melhora a análise de vídeos cirúrgicos, lidando com desafios como fumaça e pouca luz.
― 6 min ler
O VidGen-1M melhora a geração de vídeo a partir de texto com dados de alta qualidade.
― 6 min ler
Uma nova abordagem foca em inconsistências sutis na detecção de deepfakes.
― 7 min ler
Uma ferramenta de software para monitorar e analisar o movimento e o uso de espaço das vacas.
― 7 min ler
RoboMNIST ajuda robôs a reconhecer várias atividades usando WiFi, vídeo e áudio.
― 7 min ler
Kangaroo melhora a análise de vídeo integrando visuais, sons e texto de forma eficaz.
― 6 min ler
Um novo método melhora a precisão no rastreamento do movimento humano a partir de vídeo.
― 6 min ler
Um estudo revela uma nova forma de identificar emoções usando vídeo, som e texto.
― 6 min ler
Novo modelo melhora a detecção de falantes em tempo real e a eficiência na comunicação.
― 6 min ler
Novos métodos melhoram a sincronização de áudio com cenas de vídeo que mudam.
― 5 min ler
Este artigo fala sobre como os robôs aprendem habilidades de culinária usando informações da internet.
― 8 min ler
Um novo modelo cria áudio que combina com o vídeo, melhorando as experiências de mídia.
― 5 min ler
O conjunto de dados MultiClimate revela as opiniões do público sobre as mudanças climáticas através de vídeos.
― 7 min ler
Novo método ajuda robôs a aprender tarefas observando demonstrações humanas.
― 5 min ler
Um estudo mostra que empurrões funcionam pra manchetes, mas não pra vídeos deepfake fofinhos.
― 6 min ler
Esse estudo analisa como áudio, vídeo e texto trabalham juntos no reconhecimento de fala.
― 8 min ler
Mude a forma como você vê vídeos com a tecnologia inovadora de mudança de ângulo da ReCapture.
― 7 min ler