Um novo método automatiza a criação de dados para tarefas de ancoragem visual, melhorando a eficiência do aprendizado de máquina.
― 7 min ler
Ciência de ponta explicada de forma simples
Um novo método automatiza a criação de dados para tarefas de ancoragem visual, melhorando a eficiência do aprendizado de máquina.
― 7 min ler
Pesquisadores melhoram o aprendizado de formas 3D usando fontes de dados diversas para uma melhor compreensão das máquinas.
― 7 min ler
X-Former melhora como os modelos juntam a compreensão de imagem e texto.
― 9 min ler
GroupMamba melhora a eficiência e precisão do processamento de imagens em tarefas de visão computacional.
― 6 min ler
Novo método melhora modelagem 3D a partir de entradas de vídeo únicas.
― 5 min ler
Um novo método melhora a detecção 3D usando apenas anotações 2D.
― 5 min ler
Um novo modelo melhora o reconhecimento de combinações de objeto-atributo que nunca foram vistas.
― 6 min ler
Apresentando um método pra melhorar a resiliência de sistemas de IA através de ataques adversariais multitarefa.
― 6 min ler
O MeshSegmenter melhora a segmentação de modelos 3D usando texturas e métodos inovadores.
― 8 min ler
Um novo método cria imagens de alta qualidade a partir de layouts sem precisar de bancos de dados extensos.
― 7 min ler
O Ajustador Semântico Dinâmico melhora o desempenho do aprendizado auto-supervisionado em várias tarefas.
― 7 min ler
Novos métodos melhoram o reconhecimento de ações em dados visuais com análise de esqueleto.
― 5 min ler
O CycleMix melhora modelos de IA misturando estilos de imagem pra um desempenho melhor.
― 6 min ler
Um novo módulo melhora a navegação de robôs ao estimar a incerteza na segmentação de imagens.
― 7 min ler
DACCA melhora a detecção de faixas através de um aprendizado de características aprimorado e agregação de contexto.
― 9 min ler
Analisando a ascensão do reconhecimento de ações com poucos exemplos na análise de vídeo.
― 10 min ler
MetaAug reduz overfitting em PTQ através de transformações de dados inovadoras.
― 8 min ler
Uma nova técnica melhora a classificação de cenas usando redes neurais gráficas híbridas.
― 7 min ler
Apresentando o ESCAPE, um framework que melhora a precisão e a velocidade da pose humana em 3D.
― 8 min ler
Esse estudo avalia modelos de CNN e VGG16 Modificado em tarefas de reconhecimento de emoções.
― 8 min ler
Um estudo sobre como as CNNs reconhecem emoções através da análise de imagens.
― 7 min ler
Um novo método melhora a destilação de datasets, aumentando a eficiência do treinamento de modelos.
― 6 min ler
Um novo método melhora a eficiência do treinamento de detecção de objetos através de perdas baseadas em ranking em buckets.
― 6 min ler
Um método novo melhora o aprendizado de novas classes enquanto mantém o conhecimento antigo.
― 9 min ler
Apresentando o NeST pra aprender novas matérias sem esquecer as antigas.
― 7 min ler
Novo método TRG melhora a precisão na estimativa de posição da cabeça ao integrar características faciais.
― 8 min ler
Novo modelo melhora o raciocínio visual usando métodos de reconstrução 3D.
― 7 min ler
Apresentando o MC-PanDA pra melhorar a segmentação panóptica em ambientes desafiadores.
― 7 min ler
Um novo método melhora a compreensão de vídeos ao separar características dinâmicas e estáticas.
― 6 min ler
Apresentando o 360VFI pra melhorar a qualidade e a experiência de vídeo 360 graus.
― 6 min ler
Um novo método gera nuvens de pontos 3D de forma eficiente a partir de imagens RGB únicas.
― 6 min ler
Essa pesquisa apresenta um modelo de CNN para reconhecer a base e o expoente de expressões matemáticas em imagens.
― 5 min ler
Um novo framework melhora o reconhecimento de ações em vídeos usando vários modelos de visão-linguagem.
― 7 min ler
Novo método melhora modelos de deep learning para dispositivos com recursos limitados.
― 6 min ler
Novos métodos melhoram a recuperação de imagens borradas usando técnicas de deep learning.
― 8 min ler
GSN combina aprendizado de dicionário e técnicas de grafo pra melhorar a classificação de imagens médicas.
― 6 min ler
Um método pra melhorar modelos de visão-linguagem reduzindo o overfitting.
― 8 min ler
Novos métodos de dados sintéticos melhoram a precisão e a compreensão da detecção de objetos baseada em linguagem.
― 7 min ler
Novos métodos melhoram o desempenho do CLIP em diferentes domínios visuais.
― 7 min ler
Novos métodos melhoram a pegada robótica usando técnicas de modelagem avançadas.
― 6 min ler