Descubra os avanços na criação de vídeos longos que prendem a atenção do público.
Xin Yan, Yuxuan Cai, Qiuyue Wang
― 7 min ler
New Science Research Articles Everyday
Descubra os avanços na criação de vídeos longos que prendem a atenção do público.
Xin Yan, Yuxuan Cai, Qiuyue Wang
― 7 min ler
Artigos mais recentes
Po-Hsuan Huang, Jeng-Lin Li, Chin-Po Chen
― 8 min ler
Ze Zhang, Enyuan Zhao, Ziyi Wan
― 7 min ler
Vera Prohaska, Eduardo Castelló Ferrer
― 7 min ler
Taekyung Ki, Dongchan Min, Gyeongsu Chae
― 8 min ler
Muhammad Umar Farooq, Awais Khan, Ijaz Ul Haq
― 8 min ler
Explore como novas tecnologias misturam texto, imagens e sons para criar conteúdo criativo.
Shufan Li, Konstantinos Kallidromitis, Akash Gokul
― 7 min ler
O SyncFlow junta geração de áudio e vídeo pra criar conteúdo de forma tranquila.
Haohe Liu, Gael Le Lan, Xinhao Mei
― 5 min ler
SizeGS oferece um jeito mais esperto de comprimir conteúdo 3D sem perder qualidade.
Shuzhao Xie, Jiahang Liu, Weixiang Zhang
― 7 min ler
A IA aprende a criar arte através de auto-feedback pra melhorar o alinhamento das imagens.
Leigang Qu, Haochuan Li, Wenjie Wang
― 9 min ler
Usando aprendizado de máquina pra melhorar a análise e o treinamento de judô.
Anthony Miyaguchi, Jed Moutahir, Tanmay Sutar
― 9 min ler
Sistemas de IA estão aprendendo a navegar usando linguagem e percepção espacial.
Xuesong Zhang, Yunbo Xu, Jia Li
― 8 min ler
Novo método melhora modelagem 3D a partir de vídeos para games e VR.
Jinbo Yan, Rui Peng, Luyang Tang
― 6 min ler
Encontre a música perfeita feita sob medida pro seu gosto único com o Diff4Steer.
Xuchan Bao, Judith Yue Li, Zhong Yi Wan
― 7 min ler
Descubra como a compressão semântica de múltiplos itens muda o compartilhamento e o armazenamento de imagens.
Tom Bachard, Thomas Maugey
― 7 min ler
RoboMM e RoboData transformam a forma como os robôs aprendem e operam em ambientes reais.
Feng Yan, Fanfan Liu, Liming Zheng
― 8 min ler
Descubra como agentes de IA mandam mensagens ocultas por meio de ações divertidas.
Ching-Chun Chang, Isao Echizen
― 8 min ler
Descubra como a IA tá transformando música em experiências visuais de tirar o fôlego.
Leonardo Pina, Yongmin Li
― 8 min ler
Aprenda como combinar texto e imagens melhora a análise de sentimentos.
Nguyen Van Doan, Dat Tran Nguyen, Cam-Van Thi Nguyen
― 6 min ler
Descubra como o POINTS1.5 melhora as habilidades de processamento de imagem e texto.
Yuan Liu, Le Tian, Xiao Zhou
― 7 min ler
WavFusion junta áudio, texto e visuais pra reconhecer emoções de forma melhor.
Feng Li, Jiusong Luo, Wanjun Xia
― 6 min ler
O TextRefiner melhora o desempenho dos Modelos de Linguagem e Visão, deixando eles mais rápidos e precisos.
Jingjing Xie, Yuxin Zhang, Jun Peng
― 7 min ler
Explore a ascensão da música gerada por máquina e a busca por métodos de detecção.
Yupei Li, Hanqian Li, Lucia Specia
― 8 min ler
Um novo sistema revoluciona a forma como a música combina com o conteúdo de vídeo.
Shanti Stewart, Gouthaman KV, Lie Lu
― 7 min ler
Saiba mais sobre técnicas inovadoras de marca d'água em vídeos para proteger conteúdo.
Pierre Fernandez, Hady Elsahar, I. Zeki Yalniz
― 6 min ler
Um novo modelo mistura música e IA, criando melodias inovadoras.
Shansong Liu, Atin Sakkeer Hussain, Qilong Wu
― 8 min ler
OV-VSS revoluciona a forma como as máquinas entendem o conteúdo de vídeo, identificando novos objetos de forma tranquila.
Xinhao Li, Yun Liu, Guolei Sun
― 9 min ler
AI TrackMate oferece aos produtores um feedback objetivo pra melhorar suas habilidades musicais.
Yi-Lin Jiang, Chia-Ho Hsiung, Yen-Tung Yeh
― 7 min ler
Descubra como o MMCSAL melhora a eficiência de aprendizado com dados multimodais.
Meng Shen, Yake Wei, Jianxiong Yin
― 6 min ler
Aprenda sobre a Distância de Frechet na Música e seu papel na avaliação de música gerada por IA.
Jan Retkowski, Jakub Stępniak, Mateusz Modrzejewski
― 10 min ler
Descubra como a IA pode transformar o design de som em vídeos e jogos.
Sudha Krishnamurthy
― 6 min ler
Uma nova abordagem melhora a precisão e eficiência nas respostas a perguntas áudio-visuais.
Zhangbin Li, Jinxing Zhou, Jing Zhang
― 7 min ler
Um novo framework melhora o alinhamento de sons e visuais em vídeos.
Kexin Li, Zongxin Yang, Yi Yang
― 7 min ler
Revolucionando o texto-para-fala com vozes mais naturais e eficiência melhorada.
Haowei Lou, Helen Paik, Pari Delir Haghighi
― 7 min ler
Juntando vídeo e áudio pra detectar emoções melhor.
Antonio Fernandez, Suzan Awinat
― 10 min ler
Novas técnicas melhoram como as máquinas reconhecem e interpretam cenas de vídeo.
Phúc H. Le Khac, Graham Healy, Alan F. Smeaton
― 8 min ler
YingSound transforma a produção de vídeo ao automatizar a geração de efeitos sonoros.
Zihao Chen, Haomin Zhang, Xinhan Di
― 7 min ler
Pesquisadores usam ecos pra marcar áudio, garantindo que os direitos dos criadores sejam protegidos.
Christopher J. Tralie, Matt Amery, Benjamin Douglas
― 8 min ler
Este estudo avalia como os modelos de linguagem reconhecem entidades musicais em texto.
Simon Hachmeier, Robert Jäschke
― 8 min ler
Descubra como as músicas de capa são identificadas no YouTube usando métodos novos.
Simon Hachmeier, Robert Jäschke
― 7 min ler
Aprenda como os padrões de voo mantêm os drones seguros e organizados.
Shuqin Zhu, Shahram Ghandeharizadeh
― 6 min ler
Descubra como drones criam exibições 3D interativas para entretenimento e saúde.
Nima Yazdani, Hamed Alimohammadzadeh, Shahram Ghandeharizadeh
― 6 min ler
Um novo método ajuda a resumir o conteúdo de vídeo de forma fácil.
Shiping Ge, Qiang Chen, Zhiwei Jiang
― 7 min ler
Um novo modelo acelera a busca de vídeos enquanto melhora a precisão.
Jinpeng Wang, Niu Lian, Jun Li
― 7 min ler
DAAN melhora como as máquinas aprendem com dados áudio-visuais em cenários zero-shot.
RunLin Yu, Yipu Gong, Wenrui Li
― 6 min ler
Transforme suas filmagens com controle de câmera melhorado e efeitos artísticos.
Xi Wang, Robin Courant, Marc Christie
― 8 min ler