GeCo melhora a contagem de objetos com menos exemplos, aumentando a precisão e a confiabilidade.
Jer Pelhan, Alan Lukežič, Vitjan Zavrtanik
― 6 min ler
Ciência de ponta explicada de forma simples
GeCo melhora a contagem de objetos com menos exemplos, aumentando a precisão e a confiabilidade.
Jer Pelhan, Alan Lukežič, Vitjan Zavrtanik
― 6 min ler
Um novo método melhora a classificação de privacidade de imagens com explicações claras e fáceis de entender.
Alina Elena Baia, Andrea Cavallaro
― 8 min ler
Novo método melhora imagens de TC para um planejamento de tratamento de câncer mais eficaz.
Belén Serrano-Antón, Mubashara Rehman, Niki Martinel
― 7 min ler
Melhorias na percepção de LiDAR aumentam o desempenho em ambientes com múltiplos sensores.
Marc Uecker, J. Marius Zöllner
― 8 min ler
Um conjunto de dados abrangente tem como objetivo melhorar a previsão e resposta a enchentes globalmente.
Brandon Victor, Mathilde Letard, Peter Naylor
― 8 min ler
Um método pra ter imagens de satélite mais claras direto dos dados brutos.
Michael Sprintson, Rama Chellappa, Cheng Peng
― 7 min ler
O CION melhora a reidentificação de pessoas ao focar nas correlações de identidade entre vídeos.
Jialong Zuo, Ying Nie, Hanyu Zhou
― 7 min ler
Um framework que junta diferentes tipos de conhecimento pra melhorar o desempenho do modelo.
Yaomin Huang, Zaomin Yan, Chaomin Shen
― 6 min ler
Um novo método melhora a detecção de alvo de olhar com menos dados rotulados.
Francesco Tonini, Nicola Dall'Asen, Lorenzo Vaquero
― 8 min ler
Uma nova abordagem melhora o desempenho de modelos de deep learning em meio ao barulho.
Seyedarmin Azizi, Mohammad Erfan Sadeghi, Mehdi Kamal
― 6 min ler
Um novo framework melhora a rotulagem de pixels ao lidar com a incerteza na segmentação semântica.
Xiaoke Hao, Shiyu Liu, Chuanbo Feng
― 8 min ler
Esse estudo avalia a eficácia de modelos pré-treinados em aplicações de Observação da Terra.
Jose Sosa, Mohamed Aloulou, Danila Rukhovich
― 7 min ler
O framework Temporal2Seq simplifica várias tarefas de compreensão de vídeo em um só modelo.
Min Yang, Zichen Zhang, Limin Wang
― 9 min ler
TAKFL otimiza o compartilhamento de conhecimento no aprendizado federado para as diferentes capacidades dos dispositivos.
Mahdi Morafah, Vyacheslav Kungurtsev, Hojin Chang
― 7 min ler
Um método que alinha formas 3D com imagens 2D sem pontos correspondentes.
Jingwei Song, Maani Ghaffari
― 7 min ler
Explore os conceitos essenciais da física molecular e suas aplicações práticas.
Jun Liu, Geng Yuan, Weihao Zeng
― 5 min ler
Esse novo método facilita a geração de imagens em modelos de IA, melhorando a eficiência e a velocidade.
Seongmin Hong, Suh Yoon Jeon, Kyeonghyun Lee
― 7 min ler
Um novo framework melhora a qualidade dos datasets de vídeo-linguagem através de refinamento iterativo.
Xiao Wang, Jianlong Wu, Zijia Lin
― 6 min ler
Combinando imagens do street view com dados pra analisar as fachadas dos prédios.
Zongrong Li, Yunlei Su, Chenyuan Zhu
― 7 min ler
Um modelo pra avaliar a qualidade da segmentação sem referências de verdade.
Ahjol Senbi, Tianyu Huang, Fei Lyu
― 10 min ler
O MedCLIP-SAMv2 melhora a detecção de tumores usando técnicas de segmentação avançadas e com pouca informação rotulada.
Taha Koleilat, Hojat Asgariandehkordi, Hassan Rivaz
― 6 min ler
Um olhar sobre como as CNNs aprendem características de imagem e suas semelhanças universais.
Florentin Guth, Brice Ménard
― 8 min ler
Pesquisadores usam o CRISP pra melhorar o monitoramento da biodiversidade através de uma análise de imagem mais eficiente.
Andy V. Huynh, Lauren E. Gillespie, Jael Lopez-Saucedo
― 7 min ler
Um novo índice ajuda a avaliar a diversidade em imagens médicas geradas por IA.
Mohammed Talha Alam, Raza Imam, Mohammad Areeb Qazi
― 10 min ler
Novos métodos aceleram a codificação e decodificação de vídeo.
Hao Chen, Saining Xie, Ser-Nam Lim
― 6 min ler
Uma nova estrutura melhora a conexão entre imagens e texto.
Mayug Maniparambil, Raiymbek Akshulakov, Yasser Abdelaziz Dahou Djilali
― 8 min ler
Aprenda como modelos de machine learning podem melhorar ao enfrentar dados novos e que nunca foram vistos.
Zongbo Han, Jialong Yang, Junfan Li
― 9 min ler
Um olhar sobre o papel e os métodos dos modelos de difusão na criação de imagens.
Zheyuan Zhan, Defang Chen, Jian-Ping Mei
― 9 min ler
Explorando maneiras de melhorar modelos multimodais na hora de entender perguntas visuais.
Haowei Zhang, Jianzhe Liu, Zhen Han
― 7 min ler
Um novo modelo gera relatórios de tomografias 3D de forma eficiente e precisa.
Hao Chen, Wei Zhao, Yingli Li
― 9 min ler
Um novo processo pra gerar modelos 3D a partir de imagens 2D de forma eficiente.
Potito Aghilar, Vito Walter Anelli, Michelantonio Trizio
― 5 min ler
TrojVLM expõe vulnerabilidades nos Modelos de Linguagem Visual a ataques de backdoor.
Weimin Lyu, Lu Pang, Tengfei Ma
― 8 min ler
Esse estudo mostra métodos eficazes pra reconhecer gestos com as mãos usando imagem por ultrassom.
Keshav Bimbraw, Ankit Talele, Haichong K. Zhang
― 6 min ler
Uma nova estrutura melhora a geração de dados a partir de várias fontes usando modelos baseados em energia.
Shiyu Yuan, Jiali Cui, Hanao Li
― 6 min ler
O SATA melhora a robustez e a eficiência dos Transformers de Visão para tarefas de classificação de imagens.
Nick Nikzad, Yi Liao, Yongsheng Gao
― 5 min ler
Um novo método melhora o reconhecimento de objetos usando máscaras sem rótulos detalhados.
Heeseong Shin, Chaehyun Kim, Sunghwan Hong
― 6 min ler
Um novo método simplifica a remoção de conteúdo indesejado em conjuntos de dados visuais.
Saehyung Lee, Jisoo Mok, Sangha Park
― 7 min ler
Explorando o papel do Aprendizado Federado em melhorar a imagem médica enquanto protege a privacidade dos pacientes.
Nikolas Koutsoubis, Asim Waqas, Yasin Yilmaz
― 6 min ler
Um novo método ajuda robôs a aprender tarefas usando vídeos de humanos na internet, reduzindo as necessidades de treinamento.
Homanga Bharadhwaj, Debidatta Dwibedi, Abhinav Gupta
― 7 min ler
PPLNs melhoram o processamento de dados de câmeras de evento pra deixar as capacidades de visão computacional mais avançadas.
Chen Song, Zhenxiao Liang, Bo Sun
― 7 min ler