Uma nova estrutura melhora a conexão entre imagens e texto.
Mayug Maniparambil, Raiymbek Akshulakov, Yasser Abdelaziz Dahou Djilali
― 8 min ler
Ciência de ponta explicada de forma simples
Uma nova estrutura melhora a conexão entre imagens e texto.
Mayug Maniparambil, Raiymbek Akshulakov, Yasser Abdelaziz Dahou Djilali
― 8 min ler
Aprenda como modelos de machine learning podem melhorar ao enfrentar dados novos e que nunca foram vistos.
Zongbo Han, Jialong Yang, Junfan Li
― 9 min ler
Um olhar sobre o papel e os métodos dos modelos de difusão na criação de imagens.
Zheyuan Zhan, Defang Chen, Jian-Ping Mei
― 9 min ler
Explorando maneiras de melhorar modelos multimodais na hora de entender perguntas visuais.
Haowei Zhang, Jianzhe Liu, Zhen Han
― 7 min ler
Um novo modelo gera relatórios de tomografias 3D de forma eficiente e precisa.
Hao Chen, Wei Zhao, Yingli Li
― 9 min ler
Um novo processo pra gerar modelos 3D a partir de imagens 2D de forma eficiente.
Potito Aghilar, Vito Walter Anelli, Michelantonio Trizio
― 5 min ler
TrojVLM expõe vulnerabilidades nos Modelos de Linguagem Visual a ataques de backdoor.
Weimin Lyu, Lu Pang, Tengfei Ma
― 8 min ler
Esse estudo mostra métodos eficazes pra reconhecer gestos com as mãos usando imagem por ultrassom.
Keshav Bimbraw, Ankit Talele, Haichong K. Zhang
― 6 min ler
Uma nova estrutura melhora a geração de dados a partir de várias fontes usando modelos baseados em energia.
Shiyu Yuan, Jiali Cui, Hanao Li
― 6 min ler
O SATA melhora a robustez e a eficiência dos Transformers de Visão para tarefas de classificação de imagens.
Nick Nikzad, Yi Liao, Yongsheng Gao
― 5 min ler
Um novo método melhora o reconhecimento de objetos usando máscaras sem rótulos detalhados.
Heeseong Shin, Chaehyun Kim, Sunghwan Hong
― 6 min ler
Um novo método simplifica a remoção de conteúdo indesejado em conjuntos de dados visuais.
Saehyung Lee, Jisoo Mok, Sangha Park
― 7 min ler
Explorando o papel do Aprendizado Federado em melhorar a imagem médica enquanto protege a privacidade dos pacientes.
Nikolas Koutsoubis, Asim Waqas, Yasin Yilmaz
― 6 min ler
Um novo método ajuda robôs a aprender tarefas usando vídeos de humanos na internet, reduzindo as necessidades de treinamento.
Homanga Bharadhwaj, Debidatta Dwibedi, Abhinav Gupta
― 7 min ler
PPLNs melhoram o processamento de dados de câmeras de evento pra deixar as capacidades de visão computacional mais avançadas.
Chen Song, Zhenxiao Liang, Bo Sun
― 7 min ler
Uma nova abordagem melhora a detecção de assinaturas genuínas em comparação com falsificações.
Hansong Zhang, Jiangjian Guo, Kun Li
― 6 min ler
Analisando os efeitos dos métodos de poda no desempenho e na interpretabilidade do GoogLeNet.
Jonathan von Rad, Florian Seuffert
― 6 min ler
Métodos inovadores para melhorar mapas de profundidade são essenciais para realidade aumentada e virtual.
Marcos V. Conde, Florin-Alexandru Vasluianu, Jinhui Xiong
― 7 min ler
O FAST melhora a classificação de doenças usando imagens de lâmina inteira com pouca ajuda de especialistas.
Kexue Fu, Xiaoyuan Luo, Linhao Qu
― 7 min ler
Um jeito de melhorar o desempenho do modelo, mesmo com rótulos de dados errados.
Tong Wei, Hao-Tian Li, Chun-Shu Li
― 8 min ler
MedViLaM integra vários tipos de dados médicos pra uma análise e tomada de decisão melhor.
Lijian Xu, Hao Sun, Ziyu Ni
― 6 min ler
Um novo método pra acelerar a saída do modelo de difusão sem perder qualidade.
Zhenyu Zhou, Defang Chen, Can Wang
― 8 min ler
Novo modelo simplifica a geração de relatórios a partir de exames de tomografia cerebral.
Chengxin Zheng, Junzhong Ji, Yanzhao Shi
― 7 min ler
FlipClass oferece um novo método para melhorar a aprendizagem na Descoberta de Categoria Generalizada.
Haonan Lin, Wenbin An, Jiahao Wang
― 7 min ler
Um novo método melhora a identificação de objetos orientados em imagens de sensoriamento remoto.
Jiaqi Zhao, Zeyu Ding, Yong Zhou
― 6 min ler
Um método novo pra adaptar dados de séries temporais sem precisar de informações da fonte.
Yucheng Wang, Peiliang Gong, Min Wu
― 8 min ler
O sistema CIAI melhora a detecção de ruídos em imagens, aumentando a precisão do modelo de IA.
Anubhooti Jain, Susim Roy, Kwanit Gupta
― 6 min ler
Combinar prompts globais e locais melhora os modelos de aprendizado federado sem abrir mão da privacidade dos dados.
Bikang Pan, Wei Huang, Ye Shi
― 7 min ler
O VideoLISA usa linguagem pra segmentar e acompanhar objetos em vídeos de forma eficaz.
Zechen Bai, Tong He, Haiyang Mei
― 8 min ler
Um novo método melhora o realismo em animações de imagens humanas para várias aplicações.
Zhongcong Xu, Chaoyue Song, Guoxian Song
― 7 min ler
Um novo método melhora a imagem de ressonância magnética corrigindo os movimentos durante os exames.
Constantin Slioussarenko, Pierre-Yves Baudin, Marc Lapert
― 8 min ler
Um novo método melhora a identificação de pessoas entre câmeras com menos supervisão.
Xuan Tan, Xun Gong, Yang Xiang
― 6 min ler
Novo método cria modelos 3D detalhados a partir de um único vídeo.
Jeff Tan, Donglai Xiang, Shubham Tulsiani
― 5 min ler
Esse método ajuda as máquinas a planejarem ações com base em vídeos instrutivos de forma eficaz.
Md Mohaiminul Islam, Tushar Nagarajan, Huiyu Wang
― 9 min ler
Explore o processo de pintura com uma tecnologia de timelapse inovadora.
Bowei Chen, Yifan Wang, Brian Curless
― 7 min ler
Novos algoritmos melhoram a eficiência na detecção de objetos otimizando os processos de NMS.
King-Siong Si, Lu Sun, Weizhan Zhang
― 7 min ler
A NutriVision ajuda os usuários a gerenciar dietas por meio de tecnologia e recomendações personalizadas.
Madhumita Veeramreddy, Ashok Kumar Pradhan, Swetha Ghanta
― 6 min ler
Um novo método melhora a estimativa de pose humana permitindo o aprendizado contínuo de pontos-chave.
Muhammad Saif Ullah Khan, Muhammad Ahmed Ullah Khan, Muhammad Zeshan Afzal
― 6 min ler
POMONAG melhora a busca por arquitetura com foco em múltiplos objetivos pra uma eficiência melhor.
Eugenio Lomurno, Samuele Mariani, Matteo Monti
― 9 min ler
AUCSeg melhora a segmentação ao lidar com o desbalanceamento de classes no processamento de imagens.
Boyu Han, Qianqian Xu, Zhiyong Yang
― 9 min ler