EgoObjects oferece um conjunto de dados super completo pra entender objetos do ponto de vista de quem tá vendo.
― 8 min ler
Ciência de ponta explicada de forma simples
EgoObjects oferece um conjunto de dados super completo pra entender objetos do ponto de vista de quem tá vendo.
― 8 min ler
Um novo método combina previsão e detecção de saliência em vídeo, melhorando o desempenho.
― 7 min ler
Esse estudo apresenta um método pra classificar vídeos através de descrições textuais ricas.
― 7 min ler
Um novo método melhora a forma como a tecnologia detecta o comportamento humano em grupos.
― 6 min ler
MoDA melhora a segmentação semântica em vídeos usando informações de movimento.
― 6 min ler
ProtoExplorer ajuda especialistas forenses a analisar vídeos deepfake de forma eficaz.
― 10 min ler
Este artigo explica como usar redes neurais pra reconhecimento de cenas em filmes e programas.
― 7 min ler
Um novo método melhora a detecção de anomalias no trânsito em vídeos de direção para segurança.
― 6 min ler
Novo modelo melhora o rastreamento e reconhecimento de texto em conteúdo de vídeo.
― 5 min ler
Um novo método pra gerenciar dados complexos que mudam com o tempo de forma eficiente.
― 6 min ler
Novos métodos ajudam robôs a aprender habilidades de forma eficaz assistindo vídeos de especialistas.
― 10 min ler
Apresentando o PRTreID, um jeito unificado de rastrear e identificar jogadores em vídeos de esportes.
― 5 min ler
Esse estudo explora como as máquinas ligam ações aos seus resultados através da análise de vídeo.
― 9 min ler
Um framework pra tornar previsões de vídeo compreensíveis e confiáveis.
― 7 min ler
A FineBio oferece um conjunto de dados pra acompanhar as ações em experimentos biológicos através de vídeo.
― 8 min ler
O M-RAAP otimiza a combinação de dados de vídeo e texto pra melhorar os resultados de busca.
― 6 min ler
Um novo método melhora a segmentação áudio-visual sem precisar de rótulos detalhados.
― 6 min ler
Um novo conjunto de dados melhora a capacidade da IA de interpretar o comportamento humano em vídeos.
― 8 min ler
Um conjunto de dados pra avaliar as dificuldades em tarefas de montagem usando anotações em vídeo.
― 9 min ler
UniVS simplifica tarefas de segmentação de vídeo usando prompts pra uma performance e versatilidade melhores.
― 8 min ler
TV-TREES melhora a resposta a perguntas em vídeos com estruturas de raciocínio claras.
― 6 min ler
Essa pesquisa analisa a mudança de ações intencionais para ações não intencionais em vídeos.
― 5 min ler
Um novo sistema identifica as ações dos alunos em vídeos de sala de aula com alta eficiência.
― 6 min ler
Um novo método melhora a detecção de relacionamento em vídeos usando modelos especializados.
― 9 min ler
Um novo modelo identifica momentos engraçados em vídeos usando dados visuais, de áudio e de texto.
― 7 min ler
Uma abordagem inovadora pra reconhecer e localizar comportamentos de direção distraída.
― 11 min ler
Um novo método melhora a resposta a perguntas em vídeos enquanto mantém o conhecimento anterior.
― 7 min ler
Mamba mostra um potencial forte na análise de vídeo em comparação com os transformers.
― 7 min ler
HawkEye melhora modelos de vídeo-texto pra processar vídeos mais longos de forma eficaz.
― 6 min ler
Uma nova abordagem simplifica o aninhamento de vídeo ao eliminar a necessidade de etiquetas de tempo precisas.
― 9 min ler
O DINO Tracker melhora o rastreamento de pontos em vídeo, lidando bem com obstruções.
― 8 min ler
Novo método melhora a identificação de eventos incomuns em gravações de vídeo.
― 10 min ler
Aprenda como a poda de patches aumenta a eficiência dos modelos de aprendizado profundo.
― 5 min ler
Uma abordagem nova utiliza modelos de linguagem para uma análise eficiente de vídeos longos.
― 6 min ler
Um novo método melhora o reconhecimento de ações em vídeos não editados usando poucos exemplos.
― 10 min ler
A Annolid automatiza o rastreamento de animais em vídeos, ajudando os pesquisadores a estudarem o comportamento.
― 6 min ler
Novos métodos melhoram a detecção de ações em vídeos contra várias corrupções.
― 6 min ler
O modelo ASTRA melhora a precisão na identificação de ações durante partidas de futebol.
― 7 min ler
DIBS melhora a legendagem de eventos em vídeo refinando as bordas usando dados não rotulados.
― 9 min ler
Um novo método pra identificar e descrever objetos em vídeos.
― 8 min ler