Um novo desafio aborda o reconhecimento de ações de uma perspectiva em primeira pessoa usando dados multimodais.
― 10 min ler
Ciência de ponta explicada de forma simples
Um novo desafio aborda o reconhecimento de ações de uma perspectiva em primeira pessoa usando dados multimodais.
― 10 min ler
Uma olhada em métodos para rastrear ferramentas cirúrgicas em vídeos de cirurgia robótica.
― 7 min ler
Um estudo sobre como melhorar a detecção de objetos em condições ruidosas para carros autônomos.
― 6 min ler
EfficientViT melhora a velocidade e a eficiência dos transformers de visão pra aplicações em tempo real.
― 5 min ler
Novo método gera imagens internas completas a partir de visões limitadas.
― 7 min ler
Uma nova rede leve melhora a reconstrução de dados em sensoriamento comprimido.
― 8 min ler
Explorando novas maneiras de reconhecer objetos desconhecidos em visão computacional.
― 7 min ler
Uma ferramenta pra explorar e visualizar grandes coleções digitais.
― 6 min ler
O FAN-Net melhora a segmentação de lesões de AVC usando técnicas avançadas de processamento de imagem.
― 6 min ler
Um método pra estimar a sensibilidade espectral da câmera sem precisar de equipamento especializado.
― 10 min ler
Este trabalho apresenta um método para detectar segmentos de vídeo alterados de forma eficaz.
― 7 min ler
O estudo compara CNNs e transformers para análise de imagens médicas.
― 5 min ler
O SAM redefine a segmentação de imagem com capacidades flexíveis de reconhecimento de objetos.
― 6 min ler
Uma nova ferramenta que conecta texto e imagens para várias tarefas.
― 7 min ler
Apresentando técnicas para lidar melhor com reflexos em dados de nuvem de pontos.
― 5 min ler
Um novo sistema melhora a detecção de entregas usando câmeras de campainha inteligentes.
― 9 min ler
Um novo sistema melhora a precisão dos modelos de ML em dispositivos móveis sem supervisão constante.
― 8 min ler
Novo método gera imagens sintéticas diversas para melhorar o reconhecimento facial.
― 5 min ler
A pesquisa enfrenta desafios em prever o comportamento de objetos com novos conjuntos de dados.
― 6 min ler
O RHINO melhora a precisão na detecção de objetos para itens rotacionados em imagens aéreas.
― 6 min ler
Um novo método melhora a precisão de encontrar joias online usando análise de cor.
― 6 min ler
Um novo método pra criar rostos digitais realistas com dados limitados.
― 7 min ler
Analisando a importância e os obstáculos na estimativa de pose de espaçonaves usando deep learning.
― 8 min ler
Novo método melhora a resistência de redes neurais a ataques adversariais usando técnicas de NAS.
― 8 min ler
Estudo revela os pontos fortes e fracos de grandes modelos em lidar com texto em imagens.
― 5 min ler
Um novo método melhora o planejamento de trajetória de robôs por meio de aprendizado baseado em imagens.
― 6 min ler
Um novo método melhora a resposta a perguntas sobre vídeos analisando as conexões de eventos.
― 6 min ler
Uma nova abordagem melhora a estimativa da posição de objetos usando dados táteis.
― 7 min ler
Aumentando a confiabilidade dos Transformadores de Visão na análise de imagens de saúde.
― 6 min ler
Analisando as preferências de qualidade de vídeo entre os formatos HDR e SDR.
― 6 min ler
Um método em duas etapas pra limpar a chuva das imagens e melhorar a visibilidade.
― 6 min ler
Um novo método restaura dados incompletos enquanto mantém a qualidade e a não negatividade.
― 6 min ler
Uma visão geral das técnicas de segmentação de imagem e suas aplicações.
― 8 min ler
O MASCOT melhora a recuperação de vídeo-texto com técnicas de mascaramento informado e co-aprendizagem.
― 8 min ler
Um novo modelo melhora a avaliação de qualidade de vídeos HDR pra uma experiência de visualização melhor.
― 7 min ler
Meta-aprendizagem ajuda sistemas de IA a se adaptarem rapidamente a novas tarefas com menos dados.
― 6 min ler
O ULIP-2 automatiza a geração de linguagem para formas 3D, melhorando o manuseio de dados.
― 7 min ler
Um novo método melhora a precisão na previsão dos movimentos de preços das criptomoedas.
― 6 min ler
Novas descobertas a partir de conjuntos de dados do mundo real melhoram a compreensão do aprendizado com rótulos complementares.
― 8 min ler
PEFT melhora modelos de IA para imagem médica usando menos dados e recursos.
― 8 min ler