A pesquisa destaca o desafio de entender verbos em modelos de IA multimodal.
Zehao Wang, Xinpeng Liu, Xiaoqian Wu
― 8 min ler
Ciência de ponta explicada de forma simples
A pesquisa destaca o desafio de entender verbos em modelos de IA multimodal.
Zehao Wang, Xinpeng Liu, Xiaoqian Wu
― 8 min ler
Aprenda como a decomposição de vídeo transforma a edição para criadores e cineastas.
Gaurav Shrivastava, Ser-Nam Lim, Abhinav Shrivastava
― 7 min ler
Revolucionando a forma como a gente detecta e rastreia objetos em vídeos.
Khurram Azeem Hashmi, Talha Uddin Sheikh, Didier Stricker
― 7 min ler
Explore como novas tecnologias misturam texto, imagens e sons para criar conteúdo criativo.
Shufan Li, Konstantinos Kallidromitis, Akash Gokul
― 7 min ler
O EACO reduz erros de IA e melhora o raciocínio pra um desempenho melhor.
Yongxin Wang, Meng Cao, Haokun Lin
― 8 min ler
Aprenda como uma abordagem híbrida melhora modelos de aprendizado de máquina com rótulos ruidosos.
Gouranga Bala, Anuj Gupta, Subrat Kumar Behera
― 7 min ler
Descubra como o GS-Matching melhora a precisão e a eficiência do registro de nuvens de pontos 3D.
Yaojie Zhang, Tianlun Huang, Weijun Wang
― 7 min ler
UniMLVG gera vídeos de direção realistas, melhorando a navegação de carros autônomos.
Rui Chen, Zehuan Wu, Yichen Liu
― 9 min ler
Os robôs agora entendem as preferências humanas com pouco feedback, tornando o aprendizado mais eficiente.
Ran Tian, Yilin Wu, Chenfeng Xu
― 9 min ler
Transforme uma única imagem em cenas 3D incríveis sem esforço.
Avinash Paliwal, Xilong Zhou, Andrii Tsarov
― 6 min ler
Descubra como os modelos podem aprender com os erros no raciocínio visual.
Jiali Chen, Xusen Hei, Yuqi Xue
― 8 min ler
MDiFF oferece um jeito mais esperto de prever vendas de moda e reduzir desperdício.
Andrea Avogaro, Luigi Capogrosso, Franco Fummi
― 9 min ler
SizeGS oferece um jeito mais esperto de comprimir conteúdo 3D sem perder qualidade.
Shuzhao Xie, Jiahang Liu, Weixiang Zhang
― 7 min ler
Pesquisadores melhoram os métodos de imagem 3D pra uma percepção de profundidade mais bacana usando técnicas de treinamento inovadoras.
Alex Rich, Noah Stier, Pradeep Sen
― 9 min ler
Um novo sistema permite que os usuários modifiquem imagens usando texto e imagens de referência.
Wenliang Zhong, Weizhi An, Feng Jiang
― 7 min ler
Descubra como a tecnologia tá transformando a gestão de pomares de maçã com modelos inteligentes.
Ranjan Sapkota, Manoj Karkee
― 8 min ler
Pesquisadores criam referências para modelos de visão-linguagem raciocinarem sobre eventos inesperados em vídeos.
Aditya Chinchure, Sahithya Ravi, Raymond Ng
― 7 min ler
Descubra como as Redes Adversariais Generativas estão mudando a criação artística.
FNU Neha, Deepshikha Bhati, Deepak Kumar Shukla
― 8 min ler
Pesquisadores desenvolvem um novo método pra melhorar a precisão da IA de texto pra imagem.
Ziyuan Qin, Dongjie Cheng, Haoyu Wang
― 10 min ler
Novos métodos melhoram a segurança dos veículos autônomos ao detectar obstáculos na estrada com mais precisão.
Youssef Shoeb, Nazir Nayal, Azarm Nowzard
― 8 min ler
Descubra como TC3DGS melhora a eficiência dos gráficos em cenas dinâmicas.
Saqib Javed, Ahmad Jarrar Khan, Corentin Dumery
― 6 min ler
Desvendando os segredos das decisões das redes neurais de um jeito fácil.
Deepshikha Bhati, Fnu Neha, Md Amiruzzaman
― 9 min ler
Um novo método combina impressões digitais e detecção de fluxo sanguíneo pra uma verificação de identidade segura.
Xue Xian Zheng, M. M. Ur Rahma, Bilal Taha
― 5 min ler
Uma estrutura inovadora ajuda a estimar a idade biológica do cérebro usando dados de ressonância magnética.
Abd Ur Rehman, Azka Rehman, Muhammad Usman
― 7 min ler
Descubra como o Remix-DiT melhora a qualidade da imagem de forma eficiente com modelos especializados.
Gongfan Fang, Xinyin Ma, Xinchao Wang
― 6 min ler
O ONE-PIC torna a geração de imagens rápida e acessível pra todo mundo.
Ming Tao, Bing-Kun Bao, Yaowei Wang
― 7 min ler
Avaliando saídas ocultas pra proteger dados sensíveis em sistemas de IA.
Tao Huang, Qingyu Huang, Jiayang Meng
― 7 min ler
Um novo modelo que melhora a precisão de segmentação em imagens médicas 3D.
Xiang Gao, Kai Lu
― 9 min ler
Um novo modelo identifica várias espécies, melhorando o monitoramento da vida selvagem e os esforços de conservação.
Lasha Otarashvili, Tamilselvan Subramanian, Jason Holmberg
― 7 min ler
Saiba como embeddings simplificam a análise de dados de satélite para observação da Terra.
Mikolaj Czerkawski, Marcin Kluczek, Jędrzej S. Bojanowski
― 9 min ler
Nova tecnologia melhora a detecção de objetos para carros autônomos, tornando tudo mais barato.
Itay Krispin-Avraham, Roy Orfaig, Ben-Zion Bobrovsky
― 7 min ler
Novos métodos melhoram o armazenamento e o compartilhamento de nuvens de pontos 3D.
Zehan Wang, Yuxuan Wei, Hui Yuan
― 8 min ler
Novas técnicas facilitam a rotulagem de imagens de histologia pra uma pesquisa de doenças mais eficiente.
Arthur Boschet, Armand Collin, Nishka Katoch
― 6 min ler
O NCENet permite que os computadores aprendam novas categorias a partir de imagens sem esquecer as antigas.
Ye Wang, Yaxiong Wang, Guoshuai Zhao
― 6 min ler
Descubra como a síntese em tempo real cria modelos 3D detalhados a partir de vídeos.
Diwen Wan, Yuxiang Wang, Ruijie Lu
― 7 min ler
Descubra como modelos preditivos transformam a sustentabilidade da moda rápida.
Andrea Avogaro, Luigi Capogrosso, Franco Fummi
― 8 min ler
Combinar drones com a visão humana melhora as buscas em emergências.
Arturo Miguel Russell Bernal, Jane Cleland-Huang, Walter Scheirer
― 7 min ler
Descubra como o ruído adversarial afeta modelos 3D e desafia a tecnologia.
Abdurrahman Zeybey, Mehmet Ergezer, Tommy Nguyen
― 8 min ler
A pesquisa foca em ensinar as máquinas a seguir instruções de navegação faladas e escritas.
Gengze Zhou, Yicong Hong, Zun Wang
― 6 min ler
Um novo método combina rastreamento 2D e 3D pra uma reconstrução de cena melhor.
Ruida Zhang, Chengxi Li, Chenyangguang Zhang
― 7 min ler