Novos métodos melhoram como os carros autônomos percebem o que tá ao redor.
Xiaohu Lu, Hayder Radha
― 6 min ler
New Science Research Articles Everyday
Novos métodos melhoram como os carros autônomos percebem o que tá ao redor.
Xiaohu Lu, Hayder Radha
― 6 min ler
Um modelo revolucionário liga imagens e texto, melhorando a busca por informações.
Andreas Koukounas, Georgios Mastrapas, Bo Wang
― 7 min ler
Bancos de memória externa melhoram os modelos de difusão pra criar imagens e sons melhores.
Yi Tang, Peng Sun, Zhenglin Cheng
― 7 min ler
Um novo método melhora como os modelos processam informações visuais de forma eficiente.
Ke Wang, Hong Xuan
― 8 min ler
A impressão digital de tarefas pode transformar o compartilhamento de conhecimento em imagem médica.
Patrick Godau, Akriti Srivastava, Tim Adler
― 6 min ler
Um método proativo usando Modelos de Linguagem Visual tem como objetivo detectar ataques backdoor ocultos.
Kyle Stein, Andrew Arash Mahyari, Guillermo Francia
― 8 min ler
Pesquisas mostram um novo parâmetro pra melhorar a compreensão de geometria pela IA.
Jiarui Zhang, Ollie Liu, Tianyu Yu
― 6 min ler
Explore o novo conjunto de dados VisionArena que melhora as interações de IA com chats de usuários reais.
Christopher Chou, Lisa Dunlap, Koki Mashita
― 6 min ler
O StreamChat muda a forma como a gente interage com vídeo em streaming em tempo real.
Jihao Liu, Zhiding Yu, Shiyi Lan
― 8 min ler
Descubra um jeito mais rápido e fácil de editar malhas 3D que aumenta a criatividade.
Will Gao, Dilin Wang, Yuchen Fan
― 6 min ler
Saiba como a FPA melhora a geração de imagens a partir de descrições em texto de forma rápida e precisa.
Khalil Mrini, Hanlin Lu, Linjie Yang
― 7 min ler
Esse novo método facilita a edição de imagens usando comandos de texto.
Vladimir Kulikov, Matan Kleiner, Inbar Huberman-Spiegelglas
― 7 min ler
Tecnologia avançada fecha a distância entre design e criação de roupas.
Feng Zhou, Ruiyang Liu, Chen Liu
― 6 min ler
Descubra como o ASDnB melhora a detecção de falantes através da linguagem corporal e expressões faciais.
Tiago Roxo, Joana C. Costa, Pedro Inácio
― 9 min ler
Robôs de IA aprendem a navegar assistindo vídeos de ambientes internos do mundo real pra melhorar seus movimentos.
Mingfei Han, Liang Ma, Kamila Zhumakhanova
― 8 min ler
O SAM-Mix melhora a análise de imagens médicas, diminuindo o trabalho manual e aumentando a precisão.
Tyler Ward, Abdullah-Al-Zubaer Imran
― 7 min ler
Veja roupas como nunca antes com imagens planas para compras online.
Ioannis Xarchakos, Theodoros Koukopoulos
― 7 min ler
Descubra um novo jeito de criar programas visuais de forma rápida e barata.
Michal Shlapentokh-Rothman, Yu-Xiong Wang, Derek Hoiem
― 5 min ler
Uma nova ferramenta que combina imagens de satélite e do solo pra melhorar o mapeamento de terras.
Pallavi Jain, Dino Ienco, Roberto Interdonato
― 8 min ler
Uma nova abordagem combina campos neurais e modelos de deformação para captura de movimento 3D detalhada.
Aymen Merrouche, Stefanie Wuhrer, Edmond Boyer
― 7 min ler
Uma mergulhada em como os computadores identificam ações humanas com objetos.
Mingda Jia, Liming Zhao, Ge Li
― 7 min ler
Aprenda como combinar texto e imagens melhora a análise de sentimentos.
Nguyen Van Doan, Dat Tran Nguyen, Cam-Van Thi Nguyen
― 6 min ler
Descubra como o aprendizado self-supervisionado muda a detecção de Alzheimer na imagem do cérebro.
Hao-Chun Yang, Sicheng Dai, Saige Rutherford
― 7 min ler
Nova tecnologia gera imagens realistas de pessoas com facilidade.
Zijian Zhou, Shikun Liu, Xiao Han
― 7 min ler
Descubra como a CAT melhora o aprendizado de máquina com estratégias de dados inovadoras.
Sumaiya Zoha, Jeong-Gun Lee, Young-Woong Ko
― 8 min ler
Descubra como o POINTS1.5 melhora as habilidades de processamento de imagem e texto.
Yuan Liu, Le Tian, Xiao Zhou
― 7 min ler
WavFusion junta áudio, texto e visuais pra reconhecer emoções de forma melhor.
Feng Li, Jiusong Luo, Wanjun Xia
― 6 min ler
A LOMA junta características visuais e de linguagem pra melhorar as previsões em 3D.
Yubo Cui, Zhiheng Li, Jiaqiang Wang
― 7 min ler
Um novo framework melhora a rotulagem de dados para carros autônomos.
Yushan Han, Hui Zhang, Honglei Zhang
― 7 min ler
Novos métodos melhoram previsões de vídeo usando menos dados.
Gaurav Shrivastava, Abhinav Shrivastava
― 7 min ler
ALoRE otimiza o treinamento de modelos pra reconhecimento de imagem de forma eficiente e pra aplicações mais amplas.
Sinan Du, Guosheng Zhang, Keyao Wang
― 8 min ler
Como a previsão de ocupação 3D tá moldando a tecnologia de veículos autônomos.
Bohan Li, Xin Jin, Jiajun Deng
― 7 min ler
O framework DMIC inovador melhora o reconhecimento de pessoas em diferentes tipos de câmeras.
Yiming Yang, Weipeng Hu, Haifeng Hu
― 7 min ler
Um novo método pra avaliar a geração de imagens e vídeos pela IA usando gráficos de cena.
Ziqi Gao, Weikai Huang, Jieyu Zhang
― 7 min ler
O TextRefiner melhora o desempenho dos Modelos de Linguagem e Visão, deixando eles mais rápidos e precisos.
Jingjing Xie, Yuxin Zhang, Jun Peng
― 7 min ler
Aprenda como evitar o colapso do modelo em modelos generativos usando dados reais.
Huminhao Zhu, Fangyikang Wang, Tianyu Ding
― 7 min ler
Descubra como ilusões visuais impactam modelos de VQA e seu desempenho.
Mohammadmostafa Rostamkhani, Baktash Ansari, Hoorieh Sabzevari
― 6 min ler
AsyncDSB oferece uma maneira mais esperta de restaurar imagens danificadas de forma criativa.
Zihao Han, Baoquan Zhang, Lisai Zhang
― 6 min ler
Aprenda como modelos de IA leves conseguem reter conhecimento de forma eficiente.
Jiaming Lv, Haoyuan Yang, Peihua Li
― 8 min ler
Descubra como modelos de linguagem visual conectam imagens e texto para máquinas mais inteligentes.
Quang-Hung Le, Long Hoang Dang, Ngan Le
― 8 min ler