Este estudo analisa como usar redes neurais pra recuperar sinais a partir de observações barulhentas.
― 6 min ler
Ciência de ponta explicada de forma simples
Este estudo analisa como usar redes neurais pra recuperar sinais a partir de observações barulhentas.
― 6 min ler
Um novo framework melhora a eficiência e a precisão nas tarefas de segmentação semântica.
― 7 min ler
Apresentando uma nova estrutura para segmentação precisa de objetos em vídeo usando linguagem natural.
― 8 min ler
Este artigo explica como usar redes neurais pra reconhecimento de cenas em filmes e programas.
― 7 min ler
Um novo método melhora a compreensão de cenas 3D pra reconhecer objetos raros melhor.
― 6 min ler
O FGFusion melhora a detecção de objetos 3D combinando dados de lidar e câmera de forma eficaz.
― 7 min ler
DimCL melhora o aprendizado de máquina ao aumentar a diversidade das características nas representações.
― 6 min ler
O NeuralLabeling simplifica o processo de rotulagem de imagens e vídeos em visão computacional.
― 7 min ler
Abordagem inovadora melhora a eficiência e a precisão dos testes de reconhecimento de imagem.
― 7 min ler
Novos métodos para avaliar técnicas de exposição de câmeras melhoram o desempenho da odometria visual.
― 7 min ler
Um novo método melhora a modelagem 3D para objetos específicos usando técnicas neurais avançadas.
― 7 min ler
Um novo método melhora as capacidades de geração de dados dos Autoencoders Variacionais.
― 5 min ler
Um novo método melhora o treinamento de modelos através de mascaramento guiado por saliência.
― 9 min ler
Um novo método melhora as imagens da câmera para uma navegação e assistência melhores.
― 7 min ler
O ClusterFormer junta várias tarefas em um modelo versátil pra visão computacional.
― 6 min ler
Uma abordagem nova usando discriminadores mascarados melhora a transferência de estilo da imagem enquanto mantém o conteúdo.
― 8 min ler
Nova abordagem permite contar objetos usando apenas nomes de classe, melhorando a flexibilidade.
― 7 min ler
Um novo método melhora o reconhecimento de placas ao usar imagens de ângulos diferentes das câmeras.
― 7 min ler
A normalização separada melhora o desempenho do modelo transformer e a representação dos tokens.
― 7 min ler
Os robôs estão melhorando em entender e interagir com o que tá ao redor deles.
― 7 min ler
EfficientFormer melhora o desempenho do Go em computador usando arquitetura de transformer.
― 6 min ler
Pesquisadores desenvolvem robôs com visão e habilidades de decisão melhores usando processamento de imagem menor.
― 8 min ler
Este estudo avalia técnicas de estimativa de profundidade em vários ambientes internos usando um novo conjunto de dados.
― 7 min ler
Novo método melhora a compreensão de imagens através de uma melhor integração entre linguagem e visão.
― 5 min ler
Um novo método reduz os custos de computação em redes neurais profundas mantendo a precisão.
― 6 min ler
Este estudo avança como modelos de linguagem identificam referências visuais em diálogos.
― 7 min ler
A MiliPoint oferece dados super completos pra reconhecimento de atividade humana usando radar mmWave.
― 9 min ler
Um novo método melhora o desempenho de aprendizado de máquina em ambientes variados.
― 8 min ler
A Regularização de Consistência que Preserva a Ordem melhora o desempenho do modelo em várias situações.
― 7 min ler
EoRaS melhora a compreensão da forma de objetos na segmentação de vídeo.
― 7 min ler
Novo método melhora a localização de objetos usando relações entre linguagem e imagens.
― 7 min ler
Uma nova estrutura melhora o acesso e a organização de conjuntos de dados visuais para algoritmos melhores.
― 9 min ler
Uma nova abordagem pra melhorar o rastreamento de objetos em realidade aumentada usando dispositivos móveis.
― 8 min ler
Novo método foca em regiões difíceis para ataques adversariais eficazes na segmentação de vídeo.
― 7 min ler
Um novo método melhora a classificação detalhada usando descoberta de partes e aprendizado contrastivo.
― 7 min ler
Novos métodos melhoram o rastreamento de objetos e a separação de movimento em cenas de vídeo desafiadoras.
― 8 min ler
Analisando o impacto de ataques adversariais na tecnologia de Re-ID.
― 6 min ler
Este estudo foca em deep learning pra detectar conectores de chicotes automotivos.
― 7 min ler
O ViWS-Net remove de boa várias condições climáticas do vídeo, melhorando a clareza e a qualidade.
― 7 min ler
LogicSeg combina aprendizado baseado em dados e raciocínio lógico pra uma melhor compreensão de imagens.
― 8 min ler