O Plane2Depth melhora a estimativa de profundidade em cenas complexas, lidando com os desafios de baixa textura.
Li Liu, Ruijie Zhu, Jiacheng Deng
― 7 min ler
Ciência de ponta explicada de forma simples
O Plane2Depth melhora a estimativa de profundidade em cenas complexas, lidando com os desafios de baixa textura.
Li Liu, Ruijie Zhu, Jiacheng Deng
― 7 min ler
Essa pesquisa melhora a estimativa de profundidade em robôs usando meta-aprendizado pra um desempenho melhor em ambientes diferentes.
Cho-Ying Wu, Yiqi Zhong, Junying Wang
― 5 min ler
Um novo método e conjunto de dados para análise automatizada de células em pesquisas sobre o cérebro.
Valentina Vadori, Jean-Marie Graïc, Antonella Peruffo
― 6 min ler
Uma nova abordagem para criar imagens sintéticas de forma eficiente para a destilação de conjuntos de dados.
Zhe Li, Weitong Zhang, Sarah Cechnicka
― 9 min ler
MVTN melhora o reconhecimento de gestos manuais com técnicas multiescala inovadoras.
Mallika Garg, Debashis Ghosh, Pyari Mohan Pradhan
― 6 min ler
Este estudo avalia vários modelos visuais para entender cenas 3D complexas.
Yunze Man, Shuhong Zheng, Zhipeng Bao
― 10 min ler
Esse estudo avalia modelos de machine learning pra detectar lixo nos rios.
Marga Don, Stijn Pinson, Blanca Guillen Cebrian
― 5 min ler
Um novo método melhora a reconstrução de superfícies a partir de imagens esparsas, garantindo detalhes e eficiência.
Rui Peng, Shihe Shen, Kaiqiang Xiong
― 7 min ler
Explorando os benefícios da Representação Discreta Agrupada Organizada no processamento de imagem.
Rongzhen Zhao, Vivienne Wang, Juho Kannala
― 8 min ler
Um novo método melhora a precisão da segmentação usando os modelos SAM e CLIP.
Xi Chen, Haosen Yang, Sheng Jin
― 6 min ler
Novo modelo LowFormer melhora a velocidade e a precisão em tarefas visuais.
Moritz Nottebaum, Matteo Dunnhofer, Christian Micheloni
― 7 min ler
Novo método LM-Gaussian gera modelos 3D detalhados usando um número limitado de imagens de entrada.
Hanyang Yu, Xiaoxiao Long, Ping Tan
― 6 min ler
Um novo método melhora a clareza em imagens escuras usando redes neurais inovadoras.
Aoxiang Ning, Minglong Xue, Jinhong He
― 6 min ler
Um novo método facilita a conversão de ANNs para SNNs com menos consumo de energia.
Tong Bu, Maohua Li, Zhaofei Yu
― 9 min ler
Novo conjunto de dados melhora o rastreamento de múltiplos objetos em condições difíceis de vídeo.
Friedhelm Hamann, Hanxiong Li, Paul Mieske
― 7 min ler
VILA-U integra tarefas de vídeo, imagem e linguagem em uma única estrutura.
Yecheng Wu, Zhuoyang Zhang, Junyu Chen
― 7 min ler
Uma nova abordagem para melhorar a detecção de ações em vídeos usando uma nova camada TAG.
Aglind Reka, Diana Laura Borza, Dominick Reilly
― 6 min ler
Um novo método melhora a precisão na localização de objetos a partir de imagens.
Ting-Ru Liu, Hsuan-Kung Yang, Jou-Min Liu
― 5 min ler
Um novo framework que melhora a compreensão de imagens e texto juntos.
Yi Zhu, Yanpeng Zhou, Chunwei Wang
― 10 min ler
Usando IRT pra avaliar melhor o desempenho do modelo de visão computacional.
Rahul Ramachandran, Tejal Kulkarni, Charchit Sharma
― 6 min ler
A HOGraspNet oferece dados valiosos para estudar as interações entre mãos e objetos em robótica e visão computacional.
Woojin Cho, Jihyun Lee, Minjae Yi
― 7 min ler
Esse trabalho melhora os modelos de visão-linguagem com estratégias de dados melhores e técnicas inovadoras.
Yuan Liu, Zhongyin Zhao, Ziyuan Zhuang
― 8 min ler
Um método que melhora a CNN focando em áreas chave da imagem pra tomar decisões melhores.
Lars Nieradzik, Henrike Stephani, Janis Keuper
― 5 min ler
Um modelo que diferencia imagens reais de imagens geradas por computador.
Preetu Mehta, Aman Sagar, Suchi Kumari
― 6 min ler
Um novo método melhora a classificação de vídeos otimizando a escolha dos quadros.
Junho Lee, Jeongwoo Shin, Seung Woo Ko
― 9 min ler
Um método estruturado pra rotular imagens e dados com precisão usando o modelo de fluxo sigma.
Jonas Cassel, Bastian Boll, Stefania Petra
― 6 min ler
Apresentando o PIP, uma ferramenta pra detectar ataques adversariais em LVLMs.
Yudong Zhang, Ruobing Xie, Jiansheng Chen
― 6 min ler
Um novo método melhora a identificação de objetos em imagens através da integração personalizada de visual e texto.
Ruilin Yao, Shengwu Xiong, Yichen Zhao
― 6 min ler
Um novo método melhora a detecção de estradas usando diferentes fontes de dados.
Tao Ni, Xin Zhan, Tao Luo
― 7 min ler
Novos métodos melhoram a estimativa de profundidade usando imagens únicas através de aumento de dados aprimorado.
Nischal Khanal, Shivanand Venkanna Sheshappanavar
― 7 min ler
Novo método melhora a qualidade de nuvens de pontos com funções de perda ponderadas.
Fangzhou Lin, Haotian Liu, Haoying Zhou
― 7 min ler
RPP melhora o ajuste e a generalização em Modelos de Visão-Linguagem usando prompts refinados.
Zhenyuan Chen, Lingfeng Yang, Shuo Chen
― 9 min ler
Esse método melhora os conjuntos de dados de treinamento pra um desempenho melhor na segmentação de imagens.
Quang-Huy Che, Duc-Tri Le, Vinh-Tiep Nguyen
― 7 min ler
Estudo compara as habilidades humanas e de IA em reconhecer formas 3D a partir de diferentes ângulos.
Tyler Bonnen, Stephanie Fu, Yutong Bai
― 6 min ler
Analisando como modelos de visão computacional podem se alinhar com a compreensão visual humana.
Mohammad-Javad Darvishi-Bayazi, Md Rifat Arefin, Jocelyn Faubert
― 6 min ler
Novo método melhora o aprendizado contínuo em detecção de objetos.
Riccardo De Monte, Davide Dalle Pezze, Marina Ceccon
― 8 min ler
Um novo conjunto de dados tem como objetivo melhorar os métodos de detecção de morphing facial.
Haoyu Zhang, Raghavendra Ramachandra, Kiran Raja
― 8 min ler
Um olhar sobre as melhorias e desafios na navegação de máquinas usando visão e linguagem.
Xuesong Zhang, Jia Li, Yunbo Xu
― 5 min ler
Um novo framework melhora a detecção de objetos identificando instâncias fora da distribuição usando protótipos.
Junkun Chen, Jilin Mei, Liang Chen
― 7 min ler
A KRONC oferece um jeito rápido de estimar as posições das câmeras usando pontos-chave nos veículos.
Davide Di Nucci, Alessandro Simoni, Matteo Tomei
― 6 min ler