Mude a iluminação do ambiente nas fotos sem precisar mexer nas lâmpadas.
Xiaoyan Xing, Konrad Groh, Sezer Karaoglu
― 7 min ler
Ciência de ponta explicada de forma simples
Mude a iluminação do ambiente nas fotos sem precisar mexer nas lâmpadas.
Xiaoyan Xing, Konrad Groh, Sezer Karaoglu
― 7 min ler
Descubra como as máquinas estão redefinindo a criação artística sem treinamento tradicional.
Hui Ren, Joanna Materzynska, Rohit Gandikota
― 8 min ler
Descubra como personagens realistas transformam interações virtuais.
Jianping Jiang, Weiye Xiao, Zhengyu Lin
― 8 min ler
Pesquisadores desenvolvem um método pra drones melhorarem a precisão de localização usando imagens 3D.
Haoyuan Li, Chang Xu, Wen Yang
― 6 min ler
Uma nova ferramenta que responde perguntas de documentos de forma precisa e clara.
Ahmad Mohammadshirazi, Pinaki Prasad Guha Neogi, Ser-Nam Lim
― 6 min ler
Apresentando o DELT pra melhorar a diversidade de imagens na destilação de dataset.
Zhiqiang Shen, Ammar Sherif, Zeyuan Yin
― 5 min ler
Drones precisam de dados de treinamento melhores pra interpretar melhor os ambientes do mundo real.
Alina Marcu
― 8 min ler
C 3-NeRF simplifica o modelagem 3D, tornando mais fácil lidar com várias cenas.
Prajwal Singh, Ashish Tiwari, Gautam Vashishtha
― 6 min ler
O SpaRC melhora a percepção do veículo ao combinar dados de radar e câmera pra uma detecção de objetos mais eficiente.
Philipp Wolters, Johannes Gilg, Torben Teepe
― 6 min ler
Explorando a importância das classes individuais em modelos de classificação de imagens.
Tejaswini Medi, Julia Grabinski, Margret Keuper
― 6 min ler
Apresentando uma ferramenta inovadora pra entender espaços 3D com detalhes precisos.
Guofeng Mei, Wei Lin, Luigi Riz
― 6 min ler
LongVALE oferece um novo padrão para entender vídeos longos através de dados áudio-visuais.
Tiantian Geng, Jinrui Zhang, Qingni Wang
― 8 min ler
Descubra como uma nova técnica pode ajudar a separar os elementos importantes das distrações nas fotos.
Yihao Wang, Marcus Klasson, Matias Turkulainen
― 6 min ler
Testando vários modelos pra detectar atividades estranhas em dados de vídeo.
Fabien Poirier
― 12 min ler
O JetFormer cria imagens e textos juntos de um jeito eficiente.
Michael Tschannen, André Susano Pinto, Alexander Kolesnikov
― 6 min ler
Novo método melhora a estimativa de profundidade para veículos autônomos usando só uma imagem.
Gasser Elazab, Torben Gräber, Michael Unterreiner
― 6 min ler
A SASS oferece soluções inteligentes para uma vida urbana mais segura e melhor.
Navid Salami Pargoo, Mahshid Ghasemi, Shuren Xia
― 7 min ler
CogACT combina linguagem e ação pra robôs mais espertos nas tarefas do dia a dia.
Qixiu Li, Yaobo Liang, Zeyu Wang
― 6 min ler
Uma nova abordagem torna os modelos multimodais mais rápidos e eficientes.
Qiong Wu, Wenhao Lin, Weihao Ye
― 5 min ler
Aprenda como o TOrtho-Gaussian melhora a criação de mapas digitais de verdade.
Xin Wang, Wendi Zhang, Hong Xie
― 7 min ler
FLD+ melhora a avaliação de imagens geradas por computador com menos medidas e mais precisas.
Pranav Jeevan, Neeraj Nixon, Amit Sethi
― 6 min ler
MulModSeg simplifica a segmentação de imagens médicas para um diagnóstico e tratamento melhores.
Chengyin Li, Hui Zhu, Rafi Ibn Sultan
― 5 min ler
O MotionPrompt melhora a criação de vídeos, garantindo um movimento suave e consistente.
Hyelin Nam, Jaemin Kim, Dohun Lee
― 7 min ler
O SkelMamba melhora a análise de movimentos na saúde usando dados de esqueleto.
Niki Martinel, Mariano Serrao, Christian Micheloni
― 6 min ler
RAGDiffusion ajuda a criar imagens realistas de roupas usando coleta de dados avançada e geração de imagens.
Xianfeng Tan, Yuhan Li, Wenxiang Shang
― 7 min ler
Explorando avaliações de qualidade para vídeos 3D afetados por fatores ambientais.
Sria Biswas, Balasubramanyam Appina, Priyanka Kokil
― 6 min ler
Métodos inovadores melhoram a agrupamento de dados com aprendizado profundo e clustering K-means.
Debapriya Roy
― 6 min ler
Uma nova abordagem pra melhorar a compreensão de imagens e textos pela IA.
Jun Gao, Yongqi Li, Ziqiang Cao
― 6 min ler
Sketch2Cinemagraph deixa você criar imagens animadas incríveis a partir de desenhos simples.
Hao Jin, Hengyuan Chang, Xiaoxuan Xie
― 8 min ler
O VideoSAVi muda a forma como os computadores interpretam vídeos através de auto-treinamento.
Yogesh Kulkarni, Pooyan Fazli
― 9 min ler
Um novo método melhora como os computadores criam modelos 3D a partir de imagens 2D.
Chensheng Peng, Ido Sobol, Masayoshi Tomizuka
― 7 min ler
O ModPrompt ajuda detetores de objetos a se adaptarem a novas imagens de forma eficaz.
Heitor R. Medeiros, Atif Belal, Srikanth Muralidharan
― 7 min ler
Avançando a tradução de imagens médicas pra melhorar diagnósticos e o cuidado com os pacientes.
Anuja Vats, Ivar Farup, Marius Pedersen
― 8 min ler
Transformando textos em vídeos realistas, usando as leis da física.
Qiyao Xue, Xiangyu Yin, Boyuan Yang
― 7 min ler
Novas técnicas melhoram o 3D Gaussian Splatting para renderização mais rápida.
Alex Hanson, Allen Tu, Geng Lin
― 5 min ler
Uma abordagem nova pra melhorar a recuperação de imagens sem precisar de muito treinamento.
Michail Dontas, Yutong He, Naoki Murata
― 7 min ler
Novos métodos melhoram o desempenho e a eficiência em modelos de linguagem multimodais de grande escala.
Shiyu Zhao, Zhenting Wang, Felix Juefei-Xu
― 7 min ler
Um novo sistema produz vídeos realistas com movimentos lógicos.
Tianshuo Xu, Zhifei Chen, Leyi Wu
― 10 min ler
Vídeos de IA embaralham a realidade e a enganação, criando desafios de detecção.
Matyas Bohacek, Hany Farid
― 7 min ler
Novos métodos melhoram a imagem hiperespectral para várias aplicações do dia a dia.
Chia-Ming Lee, Ching-Heng Cheng, Yu-Fan Lin
― 7 min ler