Um framework leve para detecção rápida e precisa do centro de objetos.
Chen Xin, Thomas Motz, Andreas Hartel
― 6 min ler
Ciência de ponta explicada de forma simples
Um framework leve para detecção rápida e precisa do centro de objetos.
Chen Xin, Thomas Motz, Andreas Hartel
― 6 min ler
A XTRA melhora como os computadores reconhecem imagens usando menos dados e recursos.
Elad Amrani, Leonid Karlinsky, Alex Bronstein
― 5 min ler
Um novo conjunto de dados melhora as técnicas de captura e compressão de vídeo 3D.
Ge Gao, Adrian Azzarelli, Ho Man Kwan
― 7 min ler
Novos métodos melhoram a compreensão de ações humanas em modelos de vídeo-linguagem.
Reza Ghoddoosian, Nakul Agarwal, Isht Dwivedi
― 6 min ler
A FOCUS simplifica o reconhecimento de objetos com técnicas de comunicação fáceis de usar.
Jinwoo Ahn, Hyeokjoon Kwon, Hwiyeon Yoo
― 7 min ler
Um método que permite que modelos aprendam novos conceitos usando apenas descrições em texto.
Carlo Alberto Barbano, Luca Molinaro, Emanuele Aiello
― 8 min ler
O Freqformer melhora a imagem do fluxo sanguíneo retinal em 3D pra ajudar no diagnóstico de doenças.
Lingyun Wang, Bingjie Wang, Jay Chhablani
― 7 min ler
Uma nova técnica melhora a clareza das imagens em ambientes urbanos movimentados.
Xiaobao Wei, Qingpo Wuwu, Zhongyu Zhao
― 7 min ler
Usar linguagem pra melhorar a classificação de dados em diferentes situações.
Anxhelo Diko, Antonino Furnari, Luigi Cinque
― 7 min ler
ReWind ajuda os espectadores a entender vídeos longos usando um sistema de memória esperto.
Anxhelo Diko, Tinghuai Wang, Wassim Swaileh
― 6 min ler
O CellPilot ajuda na análise de amostras de tecido, melhorando a precisão na detecção de doenças.
Philipp Endres, Valentin Koch, Julia A. Schnabel
― 6 min ler
AeroGen cria imagens sintéticas pra melhorar a detecção de objetos em sensoriamento remoto.
Datao Tang, Xiangyong Cao, Xuan Wu
― 7 min ler
Mamba-CL melhora o aprendizado de IA mantendo o conhecimento antigo enquanto adquire novas tarefas.
De Cheng, Yue Lu, Lingfeng He
― 6 min ler
SplatSDF ajuda os computadores a criar modelos 3D com precisão a partir de imagens 2D.
Runfa Blark Li, Keito Suzuki, Bang Du
― 6 min ler
Aprenda como o prompt de díptico transforma texto em imagens incríveis.
Chaehun Shin, Jooyoung Choi, Heeseung Kim
― 6 min ler
Melhorando MLLMs pra seguir melhor as instruções com visuais.
Te Yang, Jian Jia, Xiangyu Zhu
― 7 min ler
Analisando a confiabilidade dos modelos de visão-linguagem em áreas críticas como a saúde.
Ferhat Ozgur Catak, Murat Kuzlu, Taylor Patrick
― 7 min ler
O framework ICER testa as medidas de segurança em modelos de texto para imagem de forma eficaz.
Zhi-Yi Chin, Kuan-Chen Mu, Mario Fritz
― 7 min ler
Um novo método melhora a detecção de anomalias em aprendizado de máquina.
Youngjae Cho, Gwangyeol Kim, Sirojbek Safarov
― 7 min ler
Um novo sistema pra entender e interpretar linguagem de sinais através de vídeo.
Shester Gueuwou, Xiaodan Du, Greg Shakhnarovich
― 6 min ler
Saiba mais sobre os desafios e avanços em criar avatares realistas a partir de gravações meio embaçadas.
Muyao Niu, Yifan Zhan, Qingtian Zhu
― 9 min ler
Um novo método melhora buscas de imagens usando uma técnica esperta chamada Proxy Imaginado.
You Li, Fan Ma, Yi Yang
― 6 min ler
Combinando linguagem e visuais pra uma percepção de profundidade melhor.
Ziyao Zeng, Jingcheng Ni, Daniel Wang
― 6 min ler
Otimizadores cautelosos melhoram a eficiência do treinamento do modelo com mudanças mínimas.
Kaizhao Liang, Lizhang Chen, Bo Liu
― 5 min ler
Aprenda a treinar computadores pra reconhecer imagens sem preconceitos.
Donggeun Ko, Dongjun Lee, Namjun Park
― 6 min ler
As máquinas podem aprender de forma contínua, melhorando sem esquecer o que já aprenderam.
Haeyong Kang, Chang D. Yoo
― 5 min ler
Uma nova maneira de entender a ocupação usando linguagem e tecnologia inteligente.
Zhu Yu, Bowen Pang, Lizhe Liu
― 5 min ler
Usando imagens pra criar recomendações personalizadas de comida e entretenimento.
Wang Bill Zhu, Deqing Fu, Kai Sun
― 6 min ler
Descubra como o deep learning molda as recomendações de música.
Aditya Sridhar
― 8 min ler
Abordagem inovadora usa imagens de câmeras de carro para criar simulações realistas para carros autônomos.
Yan Miao, Georgios Fainekos, Bardh Hoxha
― 9 min ler
Usando deep learning pra imitar o charme do filme Cinestill 800T em imagens digitais.
Pierre Mackenzie, Mika Senghaas, Raphael Achddou
― 8 min ler
MobileMamba oferece processamento de imagem eficiente para dispositivos com recursos limitados.
Haoyang He, Jiangning Zhang, Yuxuan Cai
― 7 min ler
Usando modelos avançados pra melhorar a detecção de glaucoma e ter resultados melhores pros pacientes.
Sean Wu, Jun Yu Chen, Vahid Mohammadzadeh
― 9 min ler
Um novo método melhora a forma como os computadores reconhecem imagens, segmentando partes.
Klara Janouskova, Cristian Gavrus, Jiri Matas
― 5 min ler
Descubra como rearranjar os azulejos das imagens pode criar obras de arte únicas.
Shumeet Baluja, David Marwood, Ashwin Baluja
― 6 min ler
Robôs agora usam o BimanGrasp pra melhorar suas habilidades de agarrar.
Yanming Shao, Chenxi Xiao
― 6 min ler
Novas técnicas em modelagem de formas melhoram o diagnóstico e o tratamento na saúde.
Hong Xu, Shireen Y. Elhabian
― 7 min ler
Examinando métodos para adaptação de domínio em machine learning: UDA vs. SFDA.
Fan Wang, Zhongyi Han, Xingbo Liu
― 7 min ler
Uma olhada em como o FedAlign melhora o aprendizado sem comprometer a privacidade dos dados.
Yuting Ma, Shengeng Tang, Xiaohua Xu
― 6 min ler
FastTrackTr oferece uma solução rápida e eficiente pra rastrear vários objetos em vídeos.
Pan Liao, Feng Yang, Di Wu
― 7 min ler