Artigos mais recentes para Análise de Vídeo

Visão computacional e reconhecimento de padrões Avanços nas técnicas de segmentação áudio-visual

Um novo método melhora a segmentação áudio-visual sem precisar de rótulos detalhados.

2025-09-12T20:28:15+00:00 ― 6 min ler

Multimédia BDIQA: Avançando a Resposta a Perguntas em Vídeo com Teoria da Mente

Um novo conjunto de dados melhora a capacidade da IA de interpretar o comportamento humano em vídeos.

2025-09-09T07:30:24+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Analisando Dificuldades em Tarefas de Montagem Através de Vídeo

Um conjunto de dados pra avaliar as dificuldades em tarefas de montagem usando anotações em vídeo.

2025-09-07T12:03:24+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões UniVS: Uma Abordagem Unificada para Segmentação de Vídeo

UniVS simplifica tarefas de segmentação de vídeo usando prompts pra uma performance e versatilidade melhores.

2025-09-03T02:59:12+00:00 ― 8 min ler

Computação e linguagem Apresentando o TV-TREES: Uma Nova Abordagem para VideoQA

TV-TREES melhora a resposta a perguntas em vídeos com estruturas de raciocínio claras.

2025-09-02T23:41:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Analisando Atividades Involuntárias em Vídeos

Essa pesquisa analisa a mudança de ações intencionais para ações não intencionais em vídeos.

2025-09-02T22:30:36+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Detecção de Atividades Eficiente em Vídeos de Aula

Um novo sistema identifica as ações dos alunos em vídeos de sala de aula com alta eficiência.

2025-09-02T05:15:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanço na Detecção de Relacionamento em Vídeo com MoE-VRD

Um novo método melhora a detecção de relacionamento em vídeos usando modelos especializados.

2025-08-31T23:30:18+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Detectando Humor em Vídeos com o FunnyNet-W

Um novo modelo identifica momentos engraçados em vídeos usando dados visuais, de áudio e de texto.

2025-08-30T23:09:25+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando a Segurança dos Motoristas Através do Reconhecimento de Ações

Uma abordagem inovadora pra reconhecer e localizar comportamentos de direção distraída.

2025-08-30T11:49:24+00:00 ― 11 min ler

Visão computacional e reconhecimento de padrões Avanços nas Técnicas de Perguntas e Respostas em Vídeo

Um novo método melhora a resposta a perguntas em vídeos enquanto mantém o conhecimento anterior.

2025-08-29T20:17:12+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Mamba: Um Novo Jogador na Compreensão de Vídeos

Mamba mostra um potencial forte na análise de vídeo em comparação com os transformers.

2025-08-29T12:39:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões HawkEye: Um Novo Modelo para Compreensão de Vídeos Longos

HawkEye melhora modelos de vídeo-texto pra processar vídeos mais longos de forma eficaz.

2025-08-28T23:52:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando o Aninhamento de Vídeo em Parágrafo sem Rótulos de Tempo

Uma nova abordagem simplifica o aninhamento de vídeo ao eliminar a necessidade de etiquetas de tempo precisas.

2025-08-28T03:36:06+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões DINO Tracker: Um Passo à Frente no Rastreamento de Pontos em Vídeo

O DINO Tracker melhora o rastreamento de pontos em vídeo, lidando bem com obstruções.

2025-08-27T04:33:36+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avanços nas Técnicas de Detecção de Anomalias em Vídeo

Novo método melhora a identificação de eventos incomuns em gravações de vídeo.

2025-08-27T04:02:00+00:00 ― 10 min ler

Visão computacional e reconhecimento de padrões Otimizando Deep Learning com Patch Pruning

Aprenda como a poda de patches aumenta a eficiência dos modelos de aprendizado profundo.

2025-08-26T05:39:00+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Novo Método Melhora Respostas a Perguntas em Vídeo

Uma abordagem nova utiliza modelos de linguagem para uma análise eficiente de vídeos longos.

2025-08-26T00:30:54+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Localização de Ações em Vídeos com Poucos Exemplos

Um novo método melhora o reconhecimento de ações em vídeos não editados usando poucos exemplos.

2025-08-25T04:14:18+00:00 ― 10 min ler

Visão computacional e reconhecimento de padrões Annolid: Transformando o Rastreamento de Animais na Pesquisa

A Annolid automatiza o rastreamento de animais em vídeos, ajudando os pesquisadores a estudarem o comportamento.

2025-08-25T02:23:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Melhorando a Robustez na Detecção de Ações Temporais

Novos métodos melhoram a detecção de ações em vídeos contra várias corrupções.

2025-08-24T07:26:06+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Detecção de Ações em Vídeos de Futebol

O modelo ASTRA melhora a precisão na identificação de ações durante partidas de futebol.

2025-08-23T06:09:18+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Legendagem densa de Vídeo com o Framework DIBS

DIBS melhora a legendagem de eventos em vídeo refinando as bordas usando dados não rotulados.

2025-08-22T21:35:48+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Avançando a Segmentação de Instâncias em Vídeo em Mundo Aberto

Um novo método pra identificar e descrever objetos em vídeos.

2025-08-22T14:45:00+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avanços em Rastreamento de Movimento 3D para Vídeos

Uma nova abordagem 3D melhora a precisão do rastreamento de movimento em vídeos.

2025-08-22T06:35:12+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Novo Conjunto de Dados SportsHHI Melhora a Análise de Interação em Esportes de Equipe

A SportsHHI foca nas interações humanas em vídeos de basquete e vôlei pra melhorar a análise.

2025-08-21T20:58:30+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando a Medição da Frequência Cardíaca com Vídeo

Um novo método melhora a medição da frequência cardíaca usando análise de vídeo e Modelagem facial 3D.

2025-08-19T22:06:06+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avanços em Aprender o Movimento Humano a partir de Vídeos

Um novo sistema melhora a captura de movimento em 3D a partir de vídeos em 2D.

2025-08-19T10:07:12+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Anotação de Vídeo Eficiente com Tecnologia SPAM

O SPAM oferece uma maneira mais esperta de rotular dados de vídeo de forma eficiente.

2025-08-18T18:03:24+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando a Segmentação de Objetos em Movimento com SAM e Fluxo Óptico

Este estudo melhora a segmentação de objetos em movimento usando SAM combinado com técnicas de fluxo óptico.

2025-08-18T12:15:48+00:00 ― 9 min ler

Multimédia Pegasus-1: Um Novo Modelo para Entender Vídeos

O Pegasus-1 permite que os usuários interajam com vídeos usando linguagem natural.

2025-08-17T17:10:18+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Apresentando o MovieChat: Uma Nova Maneira de Analisar Vídeos Longos

O MovieChat facilita a compreensão de vídeos longos usando técnicas de gerenciamento de memória eficazes.

2025-08-16T02:04:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Contando Ações em Vídeos com ESCounts

Um novo método melhora como a gente conta ações em vídeos usando exemplos.

2025-08-15T07:26:45+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Pesquisa de Anomalias em Vídeo

Novos métodos melhoram a compreensão e análise de eventos incomuns em vídeos.

2025-08-15T06:42:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando na Segmentação de Objetos em Vídeo a Longo Prazo

Apresentando o LVOS: um dataset pra rastrear objetos em vídeos longos.

2025-08-15T03:01:30+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando a Segmentação de Ações em Vídeos Longos

Uma nova abordagem enfrenta a segmentação de ações em vídeos longos usando transporte ótimo.

2025-08-13T21:26:15+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Aprimorando a Medição da Frequência Cardíaca a partir de Vídeos Comprimidos

Novo método melhora a precisão da medição da frequência cardíaca em vídeos comprimidos.

2025-08-13T19:09:42+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Entendendo os Caminhos de Olhar: A Importância dos Padrões de Olhar Individuais

Esse estudo mostra como os padrões de olhar pessoal afetam as interações entre humanos e robôs.

2025-08-13T16:15:54+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Entendendo Modelos de Fundamento de Vídeo

Uma imersão nos Modelos de Fundamento de Vídeo e sua importância na análise de vídeo.

2025-08-13T13:06:18+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Detecção de Movimento em Tempo Real Usando DMD

Descubra como o DMD melhora a detecção de movimento em streams de vídeo para aplicações de segurança.

2025-08-12T15:46:30+00:00 ― 4 min ler