O VideoEval estabelece um novo padrão para avaliar modelos de vídeo de forma eficaz.
― 7 min ler
Ciência de ponta explicada de forma simples
O VideoEval estabelece um novo padrão para avaliar modelos de vídeo de forma eficaz.
― 7 min ler
Um novo método melhora a compreensão da IA sobre conteúdo de vídeo.
― 6 min ler
O TrCAM-V oferece uma nova maneira de localizar objetos em vídeos usando informações mínimas.
― 7 min ler
Um novo método melhora a segmentação de objetos em vídeos com dados pouco rotulados.
― 6 min ler
Usando vídeos sem rótulo pra melhorar o reconhecimento de ações em vídeos longos.
― 7 min ler
Usando a tecnologia NeRF pra recriar cenas de crime a partir de vídeos.
― 6 min ler
Combinar áudio e informação visual melhora o reconhecimento de objetos em vídeos.
― 7 min ler
Esse estudo propõe um método novo de avaliação pra entender vídeo e texto.
― 7 min ler
ActionSwitch detecta ações em vídeos ao vivo sem precisar de informações de classe anteriores.
― 5 min ler
O LookupViT melhora as tarefas de reconhecimento visual através de um processamento de tokens eficiente.
― 7 min ler
Uma nova abordagem melhora a compreensão de vídeos longos, enfrentando desafios importantes.
― 6 min ler
O VAR usa análise de vídeo pra ajudar os árbitros em todos os níveis do futebol.
― 6 min ler
Usando tecnologia pra melhorar procedimentos médicos de emergência e dar suporte aos socorristas.
― 7 min ler
Um novo método melhora a compreensão de vídeos ao separar características dinâmicas e estáticas.
― 6 min ler
Um conjunto de dados que oferece insights sobre as interações de pedestres em cenários de trânsito.
― 7 min ler
Um novo benchmark melhora a compreensão dos modelos sobre vídeos longos e linguagem.
― 6 min ler
Um olhar sobre como a segmentação de ações melhora nossa compreensão dos comportamentos dos animais.
― 7 min ler
Ego-VPA simplifica a adaptação para análise de vídeo egocêntrico, melhorando a eficiência e o desempenho.
― 8 min ler
SANGRIA melhora a análise de vídeos cirúrgicos usando gráficos de cena dinâmicos e anotações mínimas.
― 6 min ler
Esse estudo melhora a detecção de ações em vídeo focando no contexto e na classificação.
― 7 min ler
Novo método melhora o rastreamento de pontos ligando a linguagem com dados visuais.
― 6 min ler
O SAM-2 melhora a análise de vídeos cirúrgicos, lidando com desafios como fumaça e pouca luz.
― 6 min ler
Esse modelo prevê o movimento de objetos e analisa o conteúdo de vídeo de forma eficaz.
― 6 min ler
Um novo conjunto de dados e método melhoram a localização de vídeos para narrativas complexas.
― 9 min ler
O YOWOv3 melhora a detecção de ações em vídeos com eficiência e precisão.
― 6 min ler
A COM Kitchens oferece vídeos de culinária sem edição pra estudar os processos de preparo dos alimentos.
― 6 min ler
MATR melhora a detecção de ações em vídeos não editados usando tecnologia com memória aumentada.
― 9 min ler
mPLUG-Owl3 melhora a compreensão de imagens e vídeos pra dar respostas melhores.
― 8 min ler
Nova abordagem melhora a classificação de ações usando contexto histórico em vídeos.
― 8 min ler
Esse framework melhora a localização de ações em vídeos usando representação probabilística e contexto.
― 6 min ler
Um método pra resumir vídeos de diferentes culturas e fontes de notícias.
― 6 min ler
As referências atuais subestimam a habilidade dos modelos de conectar dados de áudio e visual.
― 6 min ler
Um novo método melhora o rastreamento de objetos em vídeos em primeira pessoa usando consciência 3D.
― 7 min ler
Novos métodos melhoram a precisão e a eficiência da segmentação de vídeo para várias aplicações.
― 7 min ler
Novos métodos melhoram a detecção de ações em vídeos por meio de técnicas de treinamento inovadoras.
― 6 min ler
Analisando o poder dos modelos de fundação em tarefas eficazes de rastreamento de pontos.
― 7 min ler
Um novo método localiza eventos em vídeos usando grandes modelos pré-treinados sem treinamento específico.
― 8 min ler
Esse estudo melhora o reconhecimento de ações juntando mapas de profundidade com frames de vídeo RGB.
― 6 min ler
O ConsistencyTrack melhora o rastreamento de objetos em vídeos usando técnicas inovadoras de manejo de ruído.
― 7 min ler
Uma nova abordagem melhora a detecção de ações em vídeos, lidando com o colapso de atenção.
― 8 min ler