Artigos mais recentes para Análise de Vídeo

Visão computacional e reconhecimento de padrões Apresentando o CinePile: Um Novo Padrão em Compreensão de Vídeo

O CinePile desafia a compreensão de vídeos longos com 305.000 perguntas diversas.

2025-08-11T01:11:48+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Apresentando o BIMM: Uma Nova Maneira de os Computadores Aprenderem com Vídeos

A BIMM aprende conteúdo em vídeo imitando os caminhos do cérebro humano.

2025-08-09T11:40:18+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões JOSENet: Um Novo Sistema para Detecção de Violência em Vídeos

O JOSENet melhora a detecção em tempo real de violência em filmagens de vigilância usando métodos avançados.

2025-08-07T22:55:35+00:00 ― 9 min ler

Análise numérica Estimativa de Movimento Eficiente Usando Grades Adaptativas

Um novo método melhora a estimativa de movimento usando malhas de elementos finitos adaptativas.

2025-08-07T01:30:03+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços no Reconhecimento de Ação com Câmeras Vestíveis

Um estudo sobre reconhecer ações usando aprendizagem com poucos exemplos e dados multimodais.

2025-08-04T06:51:06+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Melhorando a Resposta a Perguntas em Vídeo através de Propriedades Dinâmicas

Novos métodos melhoram a compreensão das máquinas sobre interações dinâmicas em conteúdo de vídeo.

2025-08-03T10:02:54+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Novo Benchmark MLVU Enfrenta o Entendimento de Vídeos Longos

O benchmark MLVU tem o objetivo de melhorar a compreensão de máquinas sobre vídeos longos.

2025-08-01T11:57:54+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando a Detecção de Ação em Vídeos com Transformers

Um novo método melhora a precisão na detecção de ações em cenas de vídeo que se sobrepõem.

2025-07-30T21:23:12+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando a Segmentação de Objetos em Vídeo com Bancos de Memória Restrita

Uma nova abordagem para segmentação de objetos em vídeo melhora a precisão ao limitar o uso de memória.

2025-07-29T23:47:36+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Avaliando a Compreensão de Vídeo em Modelos de Linguagem Multimodais

Um novo padrão pretende avaliar MLLMs na compreensão de vídeos sobre vários temas.

2025-07-29T22:20:42+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Tecnologia de Entendimento de Vídeo

Um novo modelo melhora a compreensão de vídeos ao juntar codificadores de imagem e vídeo.

2025-07-29T12:28:12+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Abordando o Aumento de Anomalias em Vídeos Gerados por IA

VANE-Bench melhora a detecção de anomalias em vídeos no meio do aumento de conteúdo de IA.

2025-07-28T23:41:54+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Apresentando o Conjunto de Dados de Curtas para Compreensão de Vídeo

Um novo conjunto de dados pra melhorar a compreensão das narrativas em curtas-metragens.

2025-07-28T23:10:18+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Novo Padrão para Modelos de Vídeo-Linguagem

Um novo benchmark foca na composicionalidade na compreensão de vídeos e em modelos de linguagem.

2025-07-28T04:52:12+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Uma Nova Estrutura para Classificação de Vídeo em Tempo Real

Apresentando um método pra classificar vídeos rapidão com base na análise dos primeiros quadros.

2025-07-27T15:42:12+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Apresentando o VideoVista: Um Novo Padrão para QA de Vídeo

A VideoVista oferece uma avaliação completa para modelos de perguntas e respostas em vídeo.

2025-07-27T13:35:48+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Localização de Ação Temporal com Vocabulário Aberto

Um novo método melhora o reconhecimento de ações em vídeos usando linguagem contextual.

2025-07-25T21:50:00+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Integrando Conhecimento de Domínio para Melhores Previsões de Vídeo

Uma nova abordagem melhora a previsão de quadros de vídeo usando conhecimento de domínio.

2025-07-23T18:29:00+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços em Reconhecimento de Fala Audiovisual

Pesquisas mostram como o vídeo ajuda a melhorar o reconhecimento de fala em ambientes barulhentos.

2025-07-22T20:41:20+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões DeepMoveSORT: Avanços no Rastreamento de Objetos

DeepMoveSORT melhora a eficiência do rastreamento de objetos, especialmente em cenários de movimento complexo.

2025-07-22T04:33:48+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões KeyVideoLLM: Melhorando a Gestão de Dados de Vídeo

Um novo método melhora a gestão de dados de vídeo pra uma compreensão e eficiência melhores.

2025-07-20T06:52:30+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Sistema Multi-Agente Dinâmico para Resposta a Perguntas em Vídeo

Uma nova abordagem melhora a precisão nas respostas a perguntas baseadas em vídeo.

2025-07-19T22:19:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços em Rastreamento de Múltiplos Objetos Usando Memória Inteligente

Um novo método melhora o rastreamento de objetos gerenciando a memória de forma eficiente.

2025-07-18T11:49:12+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões FeatureSORT: Avanços em Rastreamento de Múltiplos Objetos

O FeatureSORT melhora a precisão e a flexibilidade do rastreamento em ambientes dinâmicos.

2025-07-18T09:42:48+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões VideoEval: Um Novo Padrão para Avaliação de Modelos de Vídeo

O VideoEval estabelece um novo padrão para avaliar modelos de vídeo de forma eficaz.

2025-07-17T18:26:24+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Compreensão de Vídeo com Auto-Treinamento

Um novo método melhora a compreensão da IA sobre conteúdo de vídeo.

2025-07-17T12:15:06+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Localização de Objetos em Vídeo com TrCAM-V

O TrCAM-V oferece uma nova maneira de localizar objetos em vídeos usando informações mínimas.

2025-07-17T08:41:48+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços em Segmentação de Objetos em Vídeo

Um novo método melhora a segmentação de objetos em vídeos com dados pouco rotulados.

2025-07-17T06:03:48+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando a Localização de Ações Temporais com Auto-Treinamento

Usando vídeos sem rótulo pra melhorar o reconhecimento de ações em vídeos longos.

2025-07-16T17:01:42+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Reconstruindo Cenas de Crime com Campos de Radiação Neural

Usando a tecnologia NeRF pra recriar cenas de crime a partir de vídeos.

2025-07-15T08:30:24+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Segmentação Audiovisual Referente: Uma Nova Abordagem

Combinar áudio e informação visual melhora o reconhecimento de objetos em vídeos.

2025-07-13T10:17:30+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avaliação de Modelos Vídeo-Texto: Uma Nova Abordagem

Esse estudo propõe um método novo de avaliação pra entender vídeo e texto.

2025-07-12T01:06:42+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões ActionSwitch: Uma Nova Abordagem para Detecção de Ação em Tempo Real

ActionSwitch detecta ações em vídeos ao vivo sem precisar de informações de classe anteriores.

2025-07-11T23:31:54+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Apresentando o LookupViT: Um Novo Método para Processamento Visual

O LookupViT melhora as tarefas de reconhecimento visual através de um processamento de tokens eficiente.

2025-07-11T20:53:54+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Nova Metodologia para Compreensão de Vídeos Longos

Uma nova abordagem melhora a compreensão de vídeos longos, enfrentando desafios importantes.

2025-07-11T19:42:48+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Apresentando o VARS: Uma Nova Era na Arbitragem do Futebol

O VAR usa análise de vídeo pra ajudar os árbitros em todos os níveis do futebol.

2025-07-11T15:53:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços em Sistemas de Assistência Médica Automatizada

Usando tecnologia pra melhorar procedimentos médicos de emergência e dar suporte aos socorristas.

2025-07-10T18:02:18+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avançando o Aprendizado Contrastivo em Vídeo com BOLD-DI

Um novo método melhora a compreensão de vídeos ao separar características dinâmicas e estáticas.

2025-07-10T01:50:36+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões WTS Dataset: Um Novo Foco no Comportamento de Pedestres

Um conjunto de dados que oferece insights sobre as interações de pedestres em cenários de trânsito.

2025-07-09T15:50:12+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Novo Padrão Melhora Compreensão de Vídeo e Linguagem

Um novo benchmark melhora a compreensão dos modelos sobre vídeos longos e linguagem.

2025-07-09T01:29:06+00:00 ― 6 min ler