Um novo método melhora a compreensão do layout de documentos usando texto e imagens.
Nikitha SR, Tarun Ram Menta, Mausoom Sarkar
― 7 min ler
New Science Research Articles Everyday
Um novo método melhora a compreensão do layout de documentos usando texto e imagens.
Nikitha SR, Tarun Ram Menta, Mausoom Sarkar
― 7 min ler
Uma olhada em como melhorar a criação de imagens a partir de descrições em texto.
Zhongjie Duan, Qianyi Zhao, Cen Chen
― 5 min ler
O MIVE simplifica a edição de vídeo com controle preciso e técnicas avançadas.
Samuel Teodoro, Agus Gunawan, Soo Ye Kim
― 7 min ler
Novo método transforma a maneira como a tecnologia captura movimentos das mãos com câmeras em movimento.
Zhengdi Yu, Stefanos Zafeiriou, Tolga Birdal
― 6 min ler
SLTNet transforma a maneira como as máquinas processam dados de câmeras de eventos de forma eficiente.
Xiaxin Zhu, Fangming Guo, Xianlei Long
― 8 min ler
Um novo método melhora a segmentação de ações usando informações menos detalhadas.
Elena Bueno-Benito, Mariella Dimiccoli
― 9 min ler
Descubra como o CRoF lida com rótulos bagunçados em aprendizado de máquina de forma eficiente.
Shizhuo Deng, Bowen Han, Jiaqi Chen
― 8 min ler
Um novo método ajuda a resumir o conteúdo de vídeo de forma fácil.
Shiping Ge, Qiang Chen, Zhiwei Jiang
― 7 min ler
Pesquisadores revelam estratégias eficazes para treinar Grandes Modelos de Visão-Linguagem.
Siyuan Wang, Dianyi Wang, Chengxing Zhou
― 10 min ler
Avaliar modelos de texto-para-imagem através da história da arte e teoria crítica.
Amalia Foka
― 10 min ler
Descubra como novos métodos melhoram a qualidade da imagem usando modelos menores.
Shoukun Sun, Min Xian, Tiankai Yao
― 8 min ler
Novo framework melhora o treinamento de modelos generativos, reduzindo preconceitos e aprimorando os resultados.
Vidya Prasad, Anna Vilanova, Nicola Pezzotti
― 8 min ler
Abordagem inovadora mantém os céus seguros de potenciais ameaças de drones.
Hanfang Liang, Yizhuo Yang, Jinming Hu
― 7 min ler
Pesquisadores desenvolvem o framework SPHERE pra melhorar a compreensão das máquinas sobre relações espaciais.
Wenyu Zhang, Wei En Ng, Lixin Ma
― 8 min ler
Revolucionando a datagem de artefatos de bronze antigos com conjuntos de imagens diversos.
Rixin Zhou, Honglin Pang, Qian Zhang
― 7 min ler
O SEG-SAM melhora a segmentação de imagens médicas pra um diagnóstico e tratamento melhor.
Shuangping Huang, Hao Liang, Qingfeng Wang
― 9 min ler
O CALA ajuda as máquinas a aprenderem novas categorias sem esquecer o que já sabem.
Chengyan Liu, Linglan Zhao, Fan Lyu
― 7 min ler
Um novo benchmark avalia como os modelos de IA atendem às diversas necessidades humanas.
YiFan Zhang, Shanglin Lei, Runqi Qiao
― 10 min ler
Um novo método melhora a classificação de imagens enquanto reduz o tamanho do modelo.
Guangwenjie Zou, Liang Yao, Fan Liu
― 7 min ler
Um novo método aumenta a precisão no reconhecimento de placas de carro usando deep learning.
Zahra Ebrahimi Vargoorani, Ching Yee Suen
― 7 min ler
O ChatDiT ajuda a criar imagens incríveis a partir de texto sem complicação.
Lianghua Huang, Wei Wang, Zhi-Fan Wu
― 8 min ler
Novos métodos melhoram o reconhecimento de veículos usando imagens SAR e EO.
Yuhyun Kim, Minwoo Kim, Hyobin Park
― 5 min ler
Um novo método melhora a precisão no mapeamento do uso da terra ao lidar com rótulos confusos.
Sparsh Pekhale, Rakshith Sathish, Sathisha Basavaraju
― 7 min ler
Aprenda como novos métodos de treinamento melhoram a precisão e a qualidade da restauração de imagens.
Xinlong Cheng, Tiantian Cao, Guoan Cheng
― 9 min ler
Um novo modelo acelera a busca de vídeos enquanto melhora a precisão.
Jinpeng Wang, Niu Lian, Jun Li
― 7 min ler
Nova abordagem de superpixel melhora a compreensão das decisões das redes neurais.
Shizhan Gong, Jingwei Zhang, Qi Dou
― 6 min ler
Novas técnicas melhoram a síntese de imagens de veículos a partir de dados do mundo real.
Chuang Lin, Bingbing Zhuang, Shanlin Sun
― 6 min ler
Os robôs tão aprendendo a responder perguntas sobre o que tá rolando ao redor deles com confiança.
Saumya Saxena, Blake Buchanan, Chris Paxton
― 7 min ler
Descubra como o Sensoriamento Acústico Distribuído tá mudando a monitorização do trânsito nas cidades.
Khen Cohen, Liav Hen, Ariel Lellouch
― 7 min ler
MegaPairs conecta imagens e texto pra resultados de busca melhores.
Junjie Zhou, Zheng Liu, Ze Liu
― 7 min ler
Um novo método melhora a análise de imagens de lâminas inteiras para diagnósticos patológicos mais precisos.
Kunming Tang, Zhiguo Jiang, Jun Shi
― 8 min ler
Um novo método melhora a criação de imagens a partir de visões limitadas usando reconstrução 3D.
Tung Do, Thuan Hoang Nguyen, Anh Tuan Tran
― 8 min ler
Aprenda como o aprendizado dividido reduz atrasos em aplicações de visão computacional em tempo real.
Nikos G. Evgenidis, Nikos A. Mitsiou, Sotiris A. Tegos
― 8 min ler
O VLM-AD melhora o raciocínio dos carros autônomos pra experiências de direção mais seguras.
Yi Xu, Yuxin Hu, Zaiwei Zhang
― 7 min ler
GenHMR transforma como a gente cria modelos 3D de humanos a partir de imagens.
Muhammad Usama Saleem, Ekkasit Pinyoanuntapong, Pu Wang
― 6 min ler
Câmeras de evento melhoram a captura de dados visuais, deixando o mapeamento de cenas e a precisão do movimento mais top.
Shuang Guo, Guillermo Gallego
― 6 min ler
FedPIA melhora o aprendizado de máquina enquanto protege a privacidade dos dados sensíveis.
Pramit Saha, Divyanshu Mishra, Felix Wagner
― 8 min ler
Descubra como os modelos de difusão transformam ruído em imagens incríveis.
Jaineet Shah, Michael Gromis, Rickston Pinto
― 6 min ler
DAAN melhora como as máquinas aprendem com dados áudio-visuais em cenários zero-shot.
RunLin Yu, Yipu Gong, Wenrui Li
― 6 min ler
O HA-RDet combina métodos baseados em âncoras e métodos sem âncoras pra melhorar a detecção de objetos em imagens aéreas.
Phuc D. A. Nguyen
― 9 min ler