Cientistas descobrem jeitos de reconstruir imagens com conceitos apagados usando técnicas avançadas.
Matan Rusanovsky, Shimon Malnick, Amir Jevnisek
― 6 min ler
Ciência de ponta explicada de forma simples
Cientistas descobrem jeitos de reconstruir imagens com conceitos apagados usando técnicas avançadas.
Matan Rusanovsky, Shimon Malnick, Amir Jevnisek
― 6 min ler
Explorando como as características dos dados afetam o desempenho do aprendizado auto-supervisionado.
Raynor Kirkson E. Chavez, Kyle Gabriel M. Reynoso
― 6 min ler
Saiba como o framework POBF transforma o reconhecimento de imagens com dados limitados.
Zilin Du, Haoxin Li, Jianfei Yu
― 8 min ler
Novas técnicas melhoram a precisão na detecção de pose da cabeça usando imagens sintéticas.
Ting-Ruen Wei, Haowei Liu, Huei-Chung Hu
― 8 min ler
Um novo método reduz a sobrecarga de consultas em modelos de detecção 3D.
Lizhen Xu, Shanmin Pang, Wenzhao Qiu
― 6 min ler
Aprenda como modelos menores estão mudando a reconstrução 3D a partir de imagens.
Aditya Dutt, Ishikaa Lunawat, Manpreet Kaur
― 7 min ler
Novo método encontra objetos em vídeos longos sem precisar de muito treino.
Savya Khosla, Sethuraman T, Alexander Schwing
― 8 min ler
Novo método combina dados visuais e linguagem para uma compreensão 3D mais inteligente.
Jiahuan Cheng, Jan-Nico Zaech, Luc Van Gool
― 9 min ler
Aprenda como o DETR transforma a detecção de objetos e melhora a confiabilidade das previsões.
Young-Jin Park, Carson Sobolewski, Navid Azizan
― 10 min ler
Revolucionando o aprendizado de máquina com variações de imagem geradas por conta própria.
Varun Belagali, Srikar Yellapragada, Alexandros Graikos
― 7 min ler
Esse método melhora como os computadores encontram e rastreiam pessoas em imagens.
Miroslav Purkrabek, Jiri Matas
― 5 min ler
Pesquisadores usam dados sintéticos e IA explicável pra melhorar modelos de detecção de objetos.
Nitish Mital, Simon Malzard, Richard Walters
― 6 min ler
Um novo conjunto de dados que melhora a precisão do rastreamento de objetos em vídeo.
Sangbeom Lim, Seongchan Kim, Seungjun An
― 7 min ler
Conectando imagens e dados 3D pra detecção de localização precisa.
Qiyuan Shen, Hengwang Zhao, Weihao Yan
― 7 min ler
Um novo método pra melhorar o aprendizado em modelos de visão-linguagem que lidam com dados ruidosos.
Bikang Pan, Qun Li, Xiaoying Tang
― 8 min ler
Novo método melhora modelos 3D de movimentos animais usando dados limitados.
Christopher Fusco, Mosam Dabhi, Shin-Fang Ch'ng
― 9 min ler
Aprenda sobre segmentação de imagem, suas técnicas e a importância da incerteza na análise.
M. M. A. Valiuddin, R. J. G. van Sloun, C. G. A. Viviers
― 10 min ler
Pesquisadores encontram maneiras de reduzir imprecisões em grandes modelos de visão-linguagem.
Po-Hsuan Huang, Jeng-Lin Li, Chin-Po Chen
― 8 min ler
O GUESS reformula o aprendizado auto-supervisionado integrando incerteza pra melhorar o desempenho.
Salman Mohamadi, Gianfranco Doretto, Donald A. Adjeroh
― 8 min ler
O TCDSG melhora a análise de vídeo rastreando as relações entre objetos ao longo do tempo.
Raphael Ruschel, Md Awsafur Rahman, Hardik Prajapati
― 11 min ler
Descubra como a tecnologia de campo de luz transforma a estimativa de profundidade para robôs e veículos autônomos.
Blanca Lasheras-Hernandez, Klaus H. Strobl, Sergio Izquierdo
― 8 min ler
A estimativa de profundidade amodal ajuda as máquinas a entenderem a profundidade de objetos escondidos.
Zhenyu Li, Mykola Lavreniuk, Jian Shi
― 7 min ler
Um jeito novo de tirar sombras de imagens usando modelos generativos avançados.
Xinjie Li, Yang Zhao, Dong Wang
― 6 min ler
ProbPose melhora a previsão de pontos-chave com probabilidades calibradas e detecção de visibilidade aprimorada.
Miroslav Purkrabek, Jiri Matas
― 8 min ler
Explorando os desafios que a IA enfrenta com imagens pouco claras.
Ching-Yi Wang
― 7 min ler
Novos métodos melhoram a fusão de modelos enquanto diminuem a interferência das tarefas.
Antonio Andrea Gargiulo, Donato Crisostomi, Maria Sofia Bucarelli
― 7 min ler
Saiba como o LL-ICM melhora a qualidade da imagem enquanto diminui o tamanho do arquivo.
Yuan Xue, Qi Zhang, Chuanmin Jia
― 9 min ler
Uma imersão nas técnicas para segmentar superfícies em visão computacional.
Lukas Baumgärtner, Ronny Bergmann, Roland Herzog
― 8 min ler
Saiba como os pesquisadores criam modelos 3D a partir de imagens 2D usando novas técnicas.
Qitao Zhao, Shubham Tulsiani
― 7 min ler
Descubra como o NODE-AdvGAN engana a IA com imagens sutis.
Xinheng Xie, Yue Wu, Cuiyu He
― 7 min ler
Pesquisadores enfrentam problemas de obturador rolante em imagens de campo de luz para fotos mais claras.
Hermes McGriff, Renato Martins, Nicolas Andreff
― 7 min ler
Analisando os efeitos do treinamento multimodal nas habilidades de linguagem em IA.
Neale Ratzlaff, Man Luo, Xin Su
― 9 min ler
Aprenda como MLVGMs ajudam a proteger sistemas de visão computacional de ataques adversariais.
Dario Serez, Marco Cristani, Alessio Del Bue
― 8 min ler
Descubra o mundo fascinante das variedades de cactos na geometria algébrica.
Weronika Buczyńska, Jarosław Buczyński, Łucja Farnik
― 6 min ler
Um novo método melhora a geração de imagens usando esqueletos digitais.
Aron Fóthi, Bence Fazekas, Natabara Máté Gyöngyössy
― 5 min ler
Saiba como a visão baseada em eventos tá mudando a captura de dados na visão computacional.
Jens Egholm Pedersen, Dimitris Korakovounis, Jörg Conradt
― 6 min ler
Uma nova tecnologia de navegação tá usando várias câmeras pra melhorar a posição.
Huai Yu, Junhao Wang, Yao He
― 8 min ler
Adaptar o CLIP pra lidar com a modalidade de eventos abre novas possibilidades pro aprendizado de máquina.
Sungheon Jeong, Hanning Chen, Sanggeon Yun
― 9 min ler
A Align3R garante uma estimativa de profundidade precisa em vídeos dinâmicos com consistência melhorada.
Jiahao Lu, Tianyu Huang, Peng Li
― 9 min ler
TokenFlow une a compreensão e a criação de imagens para capacidades avançadas de IA.
Liao Qu, Huichao Zhang, Yiheng Liu
― 7 min ler