Esse estudo melhora a detecção de ações em vídeo focando no contexto e na classificação.
― 7 min ler
Ciência de ponta explicada de forma simples
Esse estudo melhora a detecção de ações em vídeo focando no contexto e na classificação.
― 7 min ler
Novo método melhora o rastreamento de pontos ligando a linguagem com dados visuais.
― 6 min ler
O SAM-2 melhora a análise de vídeos cirúrgicos, lidando com desafios como fumaça e pouca luz.
― 6 min ler
Esse modelo prevê o movimento de objetos e analisa o conteúdo de vídeo de forma eficaz.
― 6 min ler
Um novo conjunto de dados e método melhoram a localização de vídeos para narrativas complexas.
― 9 min ler
O YOWOv3 melhora a detecção de ações em vídeos com eficiência e precisão.
― 6 min ler
A COM Kitchens oferece vídeos de culinária sem edição pra estudar os processos de preparo dos alimentos.
― 6 min ler
MATR melhora a detecção de ações em vídeos não editados usando tecnologia com memória aumentada.
― 9 min ler
mPLUG-Owl3 melhora a compreensão de imagens e vídeos pra dar respostas melhores.
― 8 min ler
Nova abordagem melhora a classificação de ações usando contexto histórico em vídeos.
― 8 min ler
Esse framework melhora a localização de ações em vídeos usando representação probabilística e contexto.
― 6 min ler
Um método pra resumir vídeos de diferentes culturas e fontes de notícias.
― 6 min ler
As referências atuais subestimam a habilidade dos modelos de conectar dados de áudio e visual.
― 6 min ler
Um novo método melhora o rastreamento de objetos em vídeos em primeira pessoa usando consciência 3D.
― 7 min ler
Novos métodos melhoram a precisão e a eficiência da segmentação de vídeo para várias aplicações.
― 7 min ler
Novos métodos melhoram a detecção de ações em vídeos por meio de técnicas de treinamento inovadoras.
― 6 min ler
Analisando o poder dos modelos de fundação em tarefas eficazes de rastreamento de pontos.
― 7 min ler
Um novo método localiza eventos em vídeos usando grandes modelos pré-treinados sem treinamento específico.
― 8 min ler
Esse estudo melhora o reconhecimento de ações juntando mapas de profundidade com frames de vídeo RGB.
― 6 min ler
O ConsistencyTrack melhora o rastreamento de objetos em vídeos usando técnicas inovadoras de manejo de ruído.
― 7 min ler
Uma nova abordagem melhora a detecção de ações em vídeos, lidando com o colapso de atenção.
― 8 min ler
Técnicas inovadoras melhoram a detecção de vídeos deepfake no meio da tecnologia em evolução.
― 5 min ler
FinePseudo melhora o reconhecimento de ações detalhadas usando menos exemplos rotulados.
― 8 min ler
ViDiDi melhora o aprendizado em vídeo através do uso eficiente de dados não rotulados.
― 8 min ler
Um novo método melhora o rastreamento de objetos em vídeos com só uma câmera.
― 8 min ler
Um novo método melhora as previsões dos movimentos das mãos em vídeos para robôs e realidade virtual.
― 7 min ler
Esse framework usa imagens estáticas pra criar um treinamento de modelo de vídeo eficaz.
― 7 min ler
Um novo método melhora a precisão no rastreamento do movimento humano a partir de vídeo.
― 6 min ler
Os desafios do SoccerNet 2024 impulsionam a inovação na compreensão de vídeos de futebol.
― 6 min ler
Uma nova forma de entender as relações variáveis em ambientes em mudança.
― 7 min ler
A pesquisa foca em melhorar a capacidade da IA de reconhecer ações em vídeos.
― 7 min ler
Um novo framework melhora a detecção de relacionamento entre objetos em vídeos, aumentando a precisão e a adaptabilidade.
― 7 min ler
Uma nova abordagem melhora a resposta a perguntas em vídeos por meio do reconhecimento de texto em cena.
― 7 min ler
Walker oferece rastreamento de objetos eficiente com pouca rotulagem de dados.
― 7 min ler
O framework Temporal2Seq simplifica várias tarefas de compreensão de vídeo em um só modelo.
― 9 min ler
O VideoLISA usa linguagem pra segmentar e acompanhar objetos em vídeos de forma eficaz.
― 8 min ler
Um benchmark avaliando a capacidade dos LMMs de analisar a qualidade de vídeo.
― 9 min ler
Novo framework melhora a compreensão de vídeos em condições de pouca luz usando câmeras de eventos.
― 6 min ler
Um novo sistema identifica erros em tempo real durante as tarefas através de análise de vídeo.
― 5 min ler
Um novo método acelera o reconhecimento de ações em vídeos com menos dados.
― 6 min ler