MTFusion combina imagens e texto pra criar modelos 3D avançados.
Yu Liu, Ruowei Wang, Jiaqi Li
― 6 min ler
Ciência de ponta explicada de forma simples
MTFusion combina imagens e texto pra criar modelos 3D avançados.
Yu Liu, Ruowei Wang, Jiaqi Li
― 6 min ler
Juntando gravações de áudio com partituras pra praticar melhor.
Irmak Bukey, Michael Feffer, Chris Donahue
― 6 min ler
Novos métodos melhoram a qualidade e a resolução da imagem de forma significativa.
Brian B. Moser, Stanislav Frolov, Tobias C. Nauen
― 8 min ler
Saiba como novas técnicas de marca d'água protegem a arte digital e ideias criativas.
Liangqi Lei, Keke Gai, Jing Yu
― 7 min ler
Novo método melhora a clareza da fala usando informações visuais do ambiente.
Xinyuan Qian, Jiaran Gao, Yaodan Zhang
― 6 min ler
O TopoCode melhora a comunicação focando na estrutura de dados pra detectar erros.
Hongzhi Guo
― 7 min ler
Explorando os desafios e as implicações da tecnologia deepfake no cenário midiático atual.
Ammarah Hashmi, Sahibzada Adil Shahzad, Chia-Wen Lin
― 8 min ler
Edite vídeos com facilidade só falando as suas mudanças.
Alejandro Pardo, Jui-Hsien Wang, Bernard Ghanem
― 6 min ler
Explore a ciência fascinante por trás dos sons de bebidas sendo servidas.
Piyush Bagad, Makarand Tapaswi, Cees G. M. Snoek
― 5 min ler
Combinando linguagem e visuais pra uma percepção de profundidade melhor.
Ziyao Zeng, Jingcheng Ni, Daniel Wang
― 6 min ler
Descubra métodos inovadores de compressão de áudio e como eles impactam o som imersivo.
Toni Hirvonen, Mahmoud Namazi
― 5 min ler
Um novo método pra criar vídeos que preservam a identidade e melhoram a qualidade visual.
Shenghai Yuan, Jinfa Huang, Xianyi He
― 6 min ler
O conjunto de dados HARP muda a forma como a gente experiencia o som em ambientes virtuais.
Shivam Saini, Jürgen Peissig
― 6 min ler
Descubra como a tecnologia tá mudando os processos de avaliação de qualidade de imagem.
Shima Mohammadi, João Ascenso
― 10 min ler
Formas inovadoras de lidar com dados visuais enquanto protege o meio ambiente.
Peilin Chen, Xiaohan Fang, Meng Wang
― 6 min ler
Descubra como novas tecnologias transformam imagens em experiências sonoras imersivas.
Wei Guo, Heng Wang, Jianbo Ma
― 7 min ler
Máquinas estão se destacando em encontrar defeitos nos produtos pra melhorar a qualidade.
Tsun-Hin Cheung, Ka-Chun Fung, Songjiang Lai
― 6 min ler
A HAI-DEF oferece ferramentas pra facilitar o desenvolvimento de IA em aplicações de saúde.
Atilla P. Kiraly, Sebastien Baur, Kenneth Philbrick
― 9 min ler
Descubra como os SuperGaussianos melhoram a síntese de imagens para visões realistas.
Rui Xu, Wenyue Chen, Jiepeng Wang
― 5 min ler
Descubra como o DiM-Gestor melhora os gestos de personagens virtuais em tempo real.
Fan Zhang, Siyuan Zhao, Naye Ji
― 5 min ler
LongVALE oferece um novo padrão para entender vídeos longos através de dados áudio-visuais.
Tiantian Geng, Jinrui Zhang, Qingni Wang
― 8 min ler
Uma nova abordagem torna os modelos multimodais mais rápidos e eficientes.
Qiong Wu, Wenhao Lin, Weihao Ye
― 5 min ler
Explorando avaliações de qualidade para vídeos 3D afetados por fatores ambientais.
Sria Biswas, Balasubramanyam Appina, Priyanka Kokil
― 6 min ler
Uma visão geral dos deepfakes, seus riscos e um novo dataset em Hindi.
Sukhandeep Kaur, Mubashir Buhari, Naman Khandelwal
― 7 min ler
Descubra como a IA transforma texto em imagens incríveis com tecnologia de ponta.
Zeyi Sun, Ziyang Chu, Pan Zhang
― 8 min ler
Um novo método gera fala a partir de vídeos, melhorando a dublagem e o aprendizado de idiomas.
Akshita Gupta, Tatiana Likhomanenko, Karren Dai Yang
― 7 min ler
Descubra os avanços na criação de vídeos longos que prendem a atenção do público.
Xin Yan, Yuxuan Cai, Qiuyue Wang
― 7 min ler
Pesquisadores encontram maneiras de reduzir imprecisões em grandes modelos de visão-linguagem.
Po-Hsuan Huang, Jeng-Lin Li, Chin-Po Chen
― 8 min ler
Novos métodos lidam com a adulteração de imagens em sensoriamento remoto de forma eficaz.
Ze Zhang, Enyuan Zhao, Ziyi Wan
― 7 min ler
Revolucione sua experiência na cozinha com a orientação interativa de receitas do SPICE.
Vera Prohaska, Eduardo Castelló Ferrer
― 7 min ler
A tecnologia FLOAT anima imagens paradas, trazendo elas à vida através da fala.
Taekyung Ki, Dongchan Min, Gyeongsu Chae
― 8 min ler
Explore o mundo dos deepfakes e seu impacto na confiança na mídia.
Muhammad Umar Farooq, Awais Khan, Ijaz Ul Haq
― 8 min ler
Explore como novas tecnologias misturam texto, imagens e sons para criar conteúdo criativo.
Shufan Li, Konstantinos Kallidromitis, Akash Gokul
― 7 min ler
O SyncFlow junta geração de áudio e vídeo pra criar conteúdo de forma tranquila.
Haohe Liu, Gael Le Lan, Xinhao Mei
― 5 min ler
SizeGS oferece um jeito mais esperto de comprimir conteúdo 3D sem perder qualidade.
Shuzhao Xie, Jiahang Liu, Weixiang Zhang
― 7 min ler
A IA aprende a criar arte através de auto-feedback pra melhorar o alinhamento das imagens.
Leigang Qu, Haochuan Li, Wenjie Wang
― 9 min ler
Usando aprendizado de máquina pra melhorar a análise e o treinamento de judô.
Anthony Miyaguchi, Jed Moutahir, Tanmay Sutar
― 9 min ler
Sistemas de IA estão aprendendo a navegar usando linguagem e percepção espacial.
Xuesong Zhang, Yunbo Xu, Jia Li
― 8 min ler
Novo método melhora modelagem 3D a partir de vídeos para games e VR.
Jinbo Yan, Rui Peng, Luyang Tang
― 6 min ler
Encontre a música perfeita feita sob medida pro seu gosto único com o Diff4Steer.
Xuchan Bao, Judith Yue Li, Zhong Yi Wan
― 7 min ler