Uma nova abordagem combina campos neurais e modelos de deformação para captura de movimento 3D detalhada.
Aymen Merrouche, Stefanie Wuhrer, Edmond Boyer
― 7 min ler
Ciência de ponta explicada de forma simples
Uma nova abordagem combina campos neurais e modelos de deformação para captura de movimento 3D detalhada.
Aymen Merrouche, Stefanie Wuhrer, Edmond Boyer
― 7 min ler
Uma mergulhada em como os computadores identificam ações humanas com objetos.
Mingda Jia, Liming Zhao, Ge Li
― 7 min ler
Aprenda como combinar texto e imagens melhora a análise de sentimentos.
Nguyen Van Doan, Dat Tran Nguyen, Cam-Van Thi Nguyen
― 6 min ler
Descubra como o aprendizado self-supervisionado muda a detecção de Alzheimer na imagem do cérebro.
Hao-Chun Yang, Sicheng Dai, Saige Rutherford
― 7 min ler
Nova tecnologia gera imagens realistas de pessoas com facilidade.
Zijian Zhou, Shikun Liu, Xiao Han
― 7 min ler
Descubra como a CAT melhora o aprendizado de máquina com estratégias de dados inovadoras.
Sumaiya Zoha, Jeong-Gun Lee, Young-Woong Ko
― 8 min ler
Descubra como o POINTS1.5 melhora as habilidades de processamento de imagem e texto.
Yuan Liu, Le Tian, Xiao Zhou
― 7 min ler
WavFusion junta áudio, texto e visuais pra reconhecer emoções de forma melhor.
Feng Li, Jiusong Luo, Wanjun Xia
― 6 min ler
A LOMA junta características visuais e de linguagem pra melhorar as previsões em 3D.
Yubo Cui, Zhiheng Li, Jiaqiang Wang
― 7 min ler
Um novo framework melhora a rotulagem de dados para carros autônomos.
Yushan Han, Hui Zhang, Honglei Zhang
― 7 min ler
Novos métodos melhoram previsões de vídeo usando menos dados.
Gaurav Shrivastava, Abhinav Shrivastava
― 7 min ler
ALoRE otimiza o treinamento de modelos pra reconhecimento de imagem de forma eficiente e pra aplicações mais amplas.
Sinan Du, Guosheng Zhang, Keyao Wang
― 8 min ler
Como a previsão de ocupação 3D tá moldando a tecnologia de veículos autônomos.
Bohan Li, Xin Jin, Jiajun Deng
― 7 min ler
O framework DMIC inovador melhora o reconhecimento de pessoas em diferentes tipos de câmeras.
Yiming Yang, Weipeng Hu, Haifeng Hu
― 7 min ler
Um novo método pra avaliar a geração de imagens e vídeos pela IA usando gráficos de cena.
Ziqi Gao, Weikai Huang, Jieyu Zhang
― 7 min ler
O TextRefiner melhora o desempenho dos Modelos de Linguagem e Visão, deixando eles mais rápidos e precisos.
Jingjing Xie, Yuxin Zhang, Jun Peng
― 7 min ler
Aprenda como evitar o colapso do modelo em modelos generativos usando dados reais.
Huminhao Zhu, Fangyikang Wang, Tianyu Ding
― 7 min ler
Descubra como ilusões visuais impactam modelos de VQA e seu desempenho.
Mohammadmostafa Rostamkhani, Baktash Ansari, Hoorieh Sabzevari
― 6 min ler
AsyncDSB oferece uma maneira mais esperta de restaurar imagens danificadas de forma criativa.
Zihao Han, Baoquan Zhang, Lisai Zhang
― 6 min ler
Aprenda como modelos de IA leves conseguem reter conhecimento de forma eficiente.
Jiaming Lv, Haoyuan Yang, Peihua Li
― 8 min ler
Descubra como modelos de linguagem visual conectam imagens e texto para máquinas mais inteligentes.
Quang-Hung Le, Long Hoang Dang, Ngan Le
― 8 min ler
Nova tecnologia melhora a detecção precoce de derramamentos de petróleo pra proteger a vida marinha.
Jaeho Moon, Jeonghwan Yun, Jaehyun Kim
― 7 min ler
Modelos de Visão-Linguagem enfrentam desafios em entender a estrutura da linguagem para tarefas de imagem e texto.
Sri Harsha Dumpala, David Arps, Sageev Oore
― 7 min ler
Aprenda como a estrutura HIST melhora a compreensão de imagens e textos.
Jiayun Luo, Mir Rayat Imtiaz Hossain, Boyang Li
― 8 min ler
Um olhar sobre como o Doubly-UAP engana modelos de IA com imagens e texto.
Hee-Seon Kim, Minbeom Kim, Changick Kim
― 6 min ler
O LVS-Net melhora a análise de imagens da retina pra diagnosticar doenças precocemente.
Mehwish Mehmood, Shahzaib Iqbal, Tariq Mahmood Khan
― 6 min ler
O Video Curious Agent facilita encontrar os momentos chave em vídeos longos.
Zeyuan Yang, Delin Chen, Xueyang Yu
― 7 min ler
FovealNet melhora o rastreamento de olhar para experiências de VR imersivas.
Wenxuan Liu, Monde Duinkharjav, Qi Sun
― 8 min ler
Descubra como a IA tá mudando a forma como enfrentamos desafios de geometria.
Shihao Xu, Yiyang Luo, Wei Shi
― 7 min ler
Novo modelo QuantFormer avança nossa compreensão da atividade cerebral dos animais.
Salvatore Calcagno, Isaak Kavasidis, Simone Palazzo
― 10 min ler
Combinar modelos de imagem com sistemas de áudio aumenta a eficiência e o desempenho.
Juan Yeo, Jinkwan Jang, Kyubyung Chae
― 8 min ler
Descubra como a estrutura de Causação em Múltiplas Escalas melhora a criação de vídeos.
Xunnong Xu, Mengying Cao
― 8 min ler
Aprenda a enviar seu trabalho acadêmico com confiança e clareza.
Changqun Li, Chaofan Ding, Kexin Luan
― 6 min ler
Experimente roupas virtualmente de casa com a tecnologia inovadora Dynamic Try-On.
Jun Zheng, Jing Wang, Fuwei Zhao
― 6 min ler
Novo método melhora como a IA processa imagens e textos juntos.
Xiaofeng Zhang, Fanshuo Zeng, Yihao Quan
― 9 min ler
Uma plataforma que melhora a comunicação e colaboração entre veículos autônomos.
Hanchu Zhou, Edward Xie, Wei Shao
― 10 min ler
Descubra o processo complicado por trás das representações gráficas realistas e suas aplicações no mundo real.
Jing Yang, Pratusha Bhuvana Prasad, Qing Zhang
― 6 min ler
Uma nova técnica melhora a forma como classificamos imagens através da colaboração entre humanos e computadores.
Morgan B. Talbot, Gabriel Kreiman, James J. DiCarlo
― 6 min ler
Um novo conjunto de dados combina compreensão de vídeo em alto nível e nível de pixel para pesquisas avançadas.
Ali Athar, Xueqing Deng, Liang-Chieh Chen
― 10 min ler
Técnicas de imagem inovadoras estão mudando as práticas de cultivo de cranberry.
Faith Johnson, Ryan Meegan, Jack Lowry
― 8 min ler