Descubra como o viés de textura impacta as decisões da IA e o reconhecimento de objetos.
Blaine Hoak, Ryan Sheatsley, Patrick McDaniel
― 7 min ler
New Science Research Articles Everyday
Descubra como o viés de textura impacta as decisões da IA e o reconhecimento de objetos.
Blaine Hoak, Ryan Sheatsley, Patrick McDaniel
― 7 min ler
Artigos mais recentes
Sara Ghazanfari, Siddharth Garg, Nicolas Flammarion
― 7 min ler
Yiwen Gu, Mahir Patel, Margrit Betke
― 6 min ler
Umar Khalid, Hasan Iqbal, Azib Farooq
― 8 min ler
Yufan Zhou, Ruiyi Zhang, Jiuxiang Gu
― 7 min ler
Joshua Adrian Cahyono, Jeremy Nathan Jusuf
― 8 min ler
Descubra como os dispositivos móveis estão mudando a geração de vídeos para todo mundo.
Yushu Wu, Zhixing Zhang, Yanyu Li
― 7 min ler
Nova tecnologia melhora a análise de imagem para um diagnóstico de doenças mais preciso.
Zhenfeng Zhuang, Min Cen, Yanfeng Li
― 8 min ler
Um novo conjunto de dados revoluciona a análise de imagens médicas e suas descrições.
Muhammad Uzair Khattak, Shahina Kunhimon, Muzammal Naseer
― 9 min ler
Descubra como as classes de palavras moldam nossa comunicação e significado.
Coleman Haley, Sharon Goldwater, Edoardo Ponti
― 8 min ler
OP-LoRA melhora modelos de IA para tarefas específicas, aumentando a eficiência e o desempenho.
Piotr Teterwak, Kate Saenko, Bryan A. Plummer
― 6 min ler
Desempacotando os elementos principais que impulsionam a compreensão de vídeo em grandes modelos multimodais.
Orr Zohar, Xiaohan Wang, Yann Dubois
― 8 min ler
Um novo método melhora a fusão de imagens para mais detalhes e clareza.
Ferhat Can Ataman, Gözde Bozdaği Akar
― 7 min ler
Um novo modelo melhora a precisão na medição da altura da copa para uma melhor gestão florestal.
Tony Chang, Kiarie Ndegwa, Andreas Gros
― 8 min ler
A AlignCap melhora as descrições de imagens, permitindo que as máquinas se comuniquem os detalhes visuais de forma eficaz.
Yuan Sun, Zhao Zhang, Jorge Ortiz
― 6 min ler
DeepSeek-VL2 junta dados visuais e de texto pra interações de IA mais inteligentes.
Zhiyu Wu, Xiaokang Chen, Zizheng Pan
― 6 min ler
Novos métodos em reconstrução 3D trazem aplicações do mundo real pra vida.
Manuel Dahnert, Angela Dai, Norman Müller
― 5 min ler
Descubra como a segmentação guiada por prompt tá mudando a tecnologia de reconhecimento de imagem.
Yu-Jhe Li, Xinyang Zhang, Kun Wan
― 8 min ler
UnPIC transforma imagens 2D em representações 3D incríveis com facilidade.
Rishabh Kabra, Drew A. Hudson, Sjoerd van Steenkiste
― 8 min ler
SuperGSeg traz clareza para cenas 3D complexas com técnicas de segmentação avançadas.
Siyun Liang, Sen Wang, Kunyi Li
― 7 min ler
Tecnologia de edição avançada traz imagens realistas à vida.
Nikolai Warner, Jack Kolb, Meera Hahn
― 8 min ler
Explore o mundo fascinante dos avatares de cabeça 3D realistas de vídeos.
Jiapeng Tang, Davide Davoli, Tobias Kirschstein
― 8 min ler
Multi-Head Encoding transforma a classificação de rótulos extremos em uma tarefa mais fácil de lidar.
Daojun Liang, Haixia Zhang, Dongfeng Yuan
― 7 min ler
Descubra como a tecnologia de prova virtual tá mudando a forma como a gente compra roupas.
Hung Nguyen, Quang Qui-Vinh Nguyen, Khoi Nguyen
― 7 min ler
Descubra como o WordVIS simplifica a classificação de documentos usando cores.
Umar Khan, Saifullah, Stefan Agne
― 6 min ler
Descubra as novidades sobre como melhorar a fotografia em baixa luz e a qualidade das imagens.
Igor Morawski, Kai He, Shusil Dangi
― 10 min ler
Um novo teste pra máquinas responderem perguntas de imagem e texto.
Hyeonseok Lim, Dongjae Shin, Seohyun Song
― 8 min ler
Descubra como ilusões visuais enganam nossa percepção e afetam nosso dia a dia.
Alex Gomez-Villa, Kai Wang, Alejandro C. Parraga
― 9 min ler
Pesquisadores desenvolveram um método pra reduzir artefatos de movimento em exames de ressonância magnética.
Jiahua Xu, Dawei Zhou, Lei Hu
― 6 min ler
Descubra um jeito rápido de criar modelos 3D detalhados.
Briac Toussaint, Diego Thomas, Jean-Sébastien Franco
― 7 min ler
ManipGPT simplifica tarefas robóticas, permitindo uma interação mais inteligente com objetos.
Taewhan Kim, Hojin Bae, Zeming Li
― 8 min ler
Aprenda como novos métodos de marca d'água protegem suas imagens online.
Runyi Hu, Jie Zhang, Yiming Li
― 6 min ler
O deep learning traz uma nova esperança pra diagnosticar a osteoartrite no joelho de forma eficiente.
Nicharee Srikijkasemwat, Soumya Snigdha Kundu, Fuping Wu
― 7 min ler
Novos métodos melhoram a rotulagem de imagens para um desempenho e eficiência melhores dos modelos.
Niclas Popp, Dan Zhang, Jan Hendrik Metzen
― 8 min ler
Aprenda como as funções de distância moldam nossa compreensão do espaço e melhoram a tecnologia.
Alexander Belyaev, Pierre-Alain Fayolle
― 7 min ler
Descubra como as máquinas estão melhorando a compreensão de imagens e textos.
Yeyuan Wang, Dehong Gao, Lei Yi
― 8 min ler
o waveOrder permite que os cientistas estudem células sem atrapalhar usando imagens inovadoras.
Talon Chandler, Eduardo Hirata-Miyasaki, Ivan E. Ivanov
― 7 min ler
Descubra como a IA pode transformar o design de som em vídeos e jogos.
Sudha Krishnamurthy
― 6 min ler
Transforme vídeos de câmera única em pontos de vista dinâmicos sem esforço.
Jongmin Park, Minh-Quan Viet Bui, Juan Luis Gonzalez Bello
― 7 min ler
Um novo método melhora a destilação de datasets para reconhecimento de imagem eficiente.
Xinhao Zhong, Shuoyang Sun, Xulin Gu
― 7 min ler
Um novo método pra criar conjuntos de dados sintéticos eficientes pra modelos de deep learning.
Xinhao Zhong, Bin Chen, Hao Fang
― 8 min ler
Aprenda como a tecnologia Lidar deixa suas fotos mais nítidas e reduz o desfoque.
Ziyao Yi, Diego Valsesia, Tiziano Bianchi
― 7 min ler
Transforme suas refeições em insights de calorias com uma foto simples.
Dongyu Yao, Keling Yao, Junhong Zhou
― 9 min ler
Um novo modelo tá mudando como analisamos conteúdo em vídeo de forma eficiente.
Zhuqiang Lu, Zhenfei Yin, Mengwei He
― 6 min ler
Um novo método melhora a criação de imagens adversariais em imagens médicas.
Yasamin Medghalchi, Moein Heidari, Clayton Allard
― 8 min ler
Uma nova estrutura melhora como processamos vídeos longos de forma eficiente.
Sosuke Yamao, Natsuki Miyahara, Yuki Harazono
― 8 min ler
Descubra como o STDD melhora o reconhecimento de ações em vídeos.
Yating Yu, Congqi Cao, Yueran Zhang
― 6 min ler
O VQTalker cria avatares falantes realistas em várias línguas, melhorando as interações digitais.
Tao Liu, Ziyang Ma, Qi Chen
― 8 min ler
Explorando como os alunos podem aprender melhor que os professores em inteligência artificial.
Jianhua Zhang, Yi Gao, Ruyu Liu
― 6 min ler
Pesquisadores descobrem como a IA imita a visão humana através de redes neurais convolucionais.
Yudi Xie, Weichen Huang, Esther Alter
― 7 min ler
Um novo método aumenta a precisão do OCR para idiomas sub-representados.
Harshvivek Kashid, Pushpak Bhattacharyya
― 10 min ler
Descubra como a VehiclePaliGemma tá transformando a tecnologia de leitura de placas.
Nouar AlDahoul, Myles Joshua Toledo Tan, Raghava Reddy Tera
― 8 min ler
Um novo método usa scans 3D para prever o rosto depois da cirurgia.
Huijun Han, Congyi Zhang, Lifeng Zhu
― 8 min ler
Descubra como a AURORA facilita o design de interiores virtual para profissionais e entusiastas.
Huijun Han, Yongqing Liang, Yuanlong Zhou
― 8 min ler
Transforme pedidos simples em descrições de imagem vibrantes com o CapAgent.
Xinran Wang, Muxi Diao, Baoteng Li
― 7 min ler
Descubra como modelos generativos criam novos dados usando abordagens únicas.
Zeeshan Patel, James DeLoye, Lance Mathias
― 8 min ler
Novos métodos melhoram a detecção de defeitos na imagem industrial.
Alejandro Garnung Menéndez
― 8 min ler
RapidNet melhora a velocidade e a precisão do processamento de imagens móveis.
Mustafa Munir, Md Mostafijur Rahman, Radu Marculescu
― 7 min ler
Analisar a voz pode mostrar sinais de depressão e ajudar na intervenção precoce.
Quang-Anh N. D., Manh-Hung Ha, Thai Kim Dinh
― 6 min ler
Aprenda como a segmentação 3D ajuda os robôs a reconhecer e rotular objetos em ambientes complexos.
Luis Wiedmann, Luca Wiehe, David Rozenberszki
― 7 min ler
Descubra como o SoftVQ-VAE melhora a criação de imagens com eficiência e qualidade.
Hao Chen, Ze Wang, Xiang Li
― 7 min ler
Um novo método remove reflexos de imagens de forma eficaz usando técnicas avançadas.
Abdelrahman Elnenaey, Marwan Torki
― 8 min ler
SegHeD+ melhora a precisão na identificação de lesões da Esclerose Múltipla.
Berke Doga Basaran, Paul M. Matthews, Wenjia Bai
― 6 min ler
Pesquisadores estão trabalhando pra deixar as explicações da IA mais claras e confiáveis.
Miquel Miró-Nicolau, Antoni Jaume-i-Capó, Gabriel Moyà-Alcover
― 7 min ler
Aprenda como as máquinas interpretam vídeos, desde clipes divertidos até aplicações críticas.
Katrina Drozdov, Ravid Shwartz-Ziv, Yann LeCun
― 8 min ler
O HGT-Track combina câmeras visíveis e térmicas pra rastreamento eficaz de objetos pequenos.
Qingyu Xu, Longguang Wang, Weidong Sheng
― 5 min ler
O framework SEW tá revolucionando a análise de imagem patológica pra um tratamento de câncer melhor.
Haoming Luo, Xiaotian Yu, Shengxuming Zhang
― 7 min ler
Os sistemas de IA tão melhorando a compreensão de interfaces gráficas pra oferecer experiências melhores pros usuários.
Hai-Ming Xu, Qi Chen, Lei Wang
― 8 min ler
Descubra como a tecnologia prevê características familiares usando geração de imagens de alta qualidade.
Pin-Yen Chiu, Dai-Jie Wu, Po-Hsun Chu
― 7 min ler
Descubra como o aprendizado em contexto tá transformando a criação de vídeos.
Zhengcong Fei, Di Qiu, Changqian Yu
― 7 min ler
Uma nova abordagem melhora a precisão e eficiência nas respostas a perguntas áudio-visuais.
Zhangbin Li, Jinxing Zhou, Jing Zhang
― 7 min ler
Descubra como os dados compartilhados tornam a direção autônoma mais segura e inteligente.
Jingyu Zhang, Yilei Wang, Lang Qian
― 8 min ler
Um novo jeito de criar vídeos e imagens de forma eficiente.
Cong Wan, Xiangyang Luo, Zijian Cai
― 7 min ler
Um novo método melhora a identificação de pessoas usando informações de imagens vizinhas.
Xiao Teng, Long Lan, Dingyao Chen
― 9 min ler
Novo conjunto de dados permite comparações melhores dos algoritmos de reconstrução de CT.
Maximilian B. Kiss, Ander Biguri, Zakhar Shumaylov
― 8 min ler
Nova método melhora a detecção de regiões de tecido anormal na pesquisa médica.
Kaichen Xu, Qilong Wu, Yan Lu
― 5 min ler
Um novo sistema ajuda a monitorar e melhorar os hábitos de sentar pra ter uma saúde melhor.
Hang Jin, Xin He, Lingyun Wang
― 8 min ler
Um novo método melhora o aprendizado de máquina sem precisar dos dados originais.
Yingping Liang, Ying Fu
― 7 min ler
Uma nova abordagem ajuda a remover aqueles reflexos chatos nas lentes em fotos usando várias visões.
Gopi Raju Matta, Rahul Siddartha, Rongali Simhachala Venkata Girish
― 8 min ler
Revolucione sua experiência em vídeo com técnicas de interpolação de quadros de ponta.
Wonyong Seo, Jihyong Oh, Munchurl Kim
― 5 min ler
Robôs agora estão aprendendo tarefas observando humanos, melhorando a colaboração em várias indústrias.
Ehsan Asali, Prashant Doshi
― 10 min ler
Explora como as transformações de imagem afetam nossa visão sobre visuais.
Paula Daudén-Oliver, David Agost-Beltran, Emilio Sansano-Sansano
― 9 min ler
Novo modelo cria fontes para diversas línguas, enfrentando desafios de design de forma eficiente.
Zhiheng Wang, Jiarui Liu
― 7 min ler
Um novo framework melhora o alinhamento de sons e visuais em vídeos.
Kexin Li, Zongxin Yang, Yi Yang
― 7 min ler
Novos métodos permitem que máquinas leiam emoções em VR usando expressões faciais.
Thorben Ortmann, Qi Wang, Larissa Putzar
― 9 min ler
Pesquisadores desenvolveram um novo método pra melhorar o rastreamento de movimento usando estimativa de fluxo normal.
Dehao Yuan, Levi Burner, Jiayi Wu
― 7 min ler