Aprende sobre la Distancia Musical de Fréchet y su papel en la evaluación de música generada por IA.
Jan Retkowski, Jakub Stępniak, Mateusz Modrzejewski
― 10 minilectura
New Science Research Articles Everyday
Aprende sobre la Distancia Musical de Fréchet y su papel en la evaluación de música generada por IA.
Jan Retkowski, Jakub Stępniak, Mateusz Modrzejewski
― 10 minilectura
Últimos artículos
Sudha Krishnamurthy
― 6 minilectura
Zhangbin Li, Jinxing Zhou, Jing Zhang
― 7 minilectura
Kexin Li, Zongxin Yang, Yi Yang
― 7 minilectura
Haowei Lou, Helen Paik, Pari Delir Haghighi
― 7 minilectura
Antonio Fernandez, Suzan Awinat
― 10 minilectura
Nuevas técnicas mejoran cómo las máquinas reconocen e interpretan escenas de video.
Phúc H. Le Khac, Graham Healy, Alan F. Smeaton
― 8 minilectura
YingSound transforma la producción de video al automatizar la generación de efectos de sonido.
Zihao Chen, Haomin Zhang, Xinhan Di
― 8 minilectura
Los investigadores usan ecos para marcar el audio, asegurando que los derechos de los creadores estén protegidos.
Christopher J. Tralie, Matt Amery, Benjamin Douglas
― 9 minilectura
Este estudio evalúa qué tan bien los modelos de lenguaje reconocen entidades musicales en el texto.
Simon Hachmeier, Robert Jäschke
― 8 minilectura
Descubre cómo se identifican las versiones en YouTube usando nuevos métodos.
Simon Hachmeier, Robert Jäschke
― 6 minilectura
Descubre cómo los patrones de vuelo mantienen los drones seguros y organizados.
Shuqin Zhu, Shahram Ghandeharizadeh
― 6 minilectura
Descubre cómo los drones crean displays 3D interactivos para el entretenimiento y la salud.
Nima Yazdani, Hamed Alimohammadzadeh, Shahram Ghandeharizadeh
― 6 minilectura
Un nuevo método ayuda a resumir el contenido de videos fácilmente.
Shiping Ge, Qiang Chen, Zhiwei Jiang
― 7 minilectura
Un nuevo modelo acelera la búsqueda de videos mientras mejora la precisión.
Jinpeng Wang, Niu Lian, Jun Li
― 7 minilectura
DAAN mejora cómo las máquinas aprenden de datos audio-visuales en escenarios de cero disparos.
RunLin Yu, Yipu Gong, Wenrui Li
― 6 minilectura
Transforma tu filmmaking con un mejor control de la cámara y efectos artísticos.
Xi Wang, Robin Courant, Marc Christie
― 8 minilectura
Descubre cómo la creatividad de los jugadores está transformando los videojuegos y la participación en la comunidad.
Yuyue Liu, Haihan Duan, Wei Cai
― 6 minilectura
Un nuevo marco mejora los videos de lenguaje de señas para una mejor comunicación.
Shengeng Tang, Jiayi He, Dan Guo
― 7 minilectura
Descubre cómo los sistemas de recomendación multimodal mejoran las compras en línea.
Rongqing Kenneth Ong, Andy W. H. Khong
― 8 minilectura
Un nuevo sistema revoluciona la forma en que los diseñadores de sonido crean audio para videos.
Riccardo Fosco Gramaccioni, Christian Marinoni, Emilian Postolache
― 9 minilectura
Un nuevo método mejora la sincronización de labios en videos doblados para una experiencia de visualización más natural.
Lucas Goncalves, Prashant Mathur, Xing Niu
― 8 minilectura
Nueva tecnología convierte palabras habladas en lenguaje de señas para mejorar la comunicación.
Xu Wang, Shengeng Tang, Peipei Song
― 7 minilectura
Nueva tecnología combina sonido y visuales para mejorar la detección de drones.
Zhenyuan Xiao, Yizhuo Yang, Guili Xu
― 7 minilectura
Explorando nueva tecnología que detecta sonidos de fuentes invisibles.
Yuhang He, Sangyun Shin, Anoop Cherian
― 6 minilectura
Un nuevo enfoque predice la calidad de la imagen tanto para humanos como para máquinas.
Qi Zhang, Shanshe Wang, Xinfeng Zhang
― 8 minilectura
VERSA evalúa la calidad de voz, audio y música de manera efectiva.
Jiatong Shi, Hye-jin Shim, Jinchuan Tian
― 10 minilectura
Descubre cómo RDPM transforma la creación de imágenes usando métodos avanzados.
Xiaoping Wu, Jie Hu, Xiaoming Wei
― 10 minilectura
FACEMUG transforma la edición de fotos con herramientas precisas para ajustes faciales.
Wanglong Lu, Jikai Wang, Xiaogang Jin
― 8 minilectura
El reconocimiento dinámico de expresiones faciales transforma las interacciones humano-computadora a través del análisis de emociones en tiempo real.
Peihao Xiang, Kaida Wu, Chaohao Lin
― 9 minilectura
Combinando el lenguaje y el video para mejorar el aprendizaje en robots.
Dejie Yang, Zijing Zhao, YangLiu
― 7 minilectura
Un nuevo enfoque mejora cómo las computadoras rastrean objetos usando imágenes y texto.
X. Feng, D. Zhang, S. Hu
― 6 minilectura
Un nuevo marco para generar bailes en grupo sincronizados y naturales.
Kaixing Yang, Xulong Tang, Haoyu Wu
― 10 minilectura
Los asistentes de audio están volviéndose más inteligentes con AQA-K, mejorando sus respuestas a través del conocimiento.
Abhirama Subramanyam Penamakuri, Kiran Chhatre, Akshat Jain
― 7 minilectura
Descubre cómo la restauración de rostros ciegos trae claridad a imágenes borrosas.
Wanglong Lu, Jikai Wang, Tao Wang
― 7 minilectura
Surgen métodos innovadores para combatir el auge de los deepfakes realistas.
Yi Zhang, Weize Gao, Changtao Miao
― 9 minilectura
Descubre cómo ChartAdapter transforma gráficos complejos en resúmenes claros.
Peixin Xu, Yujuan Ding, Wenqi Fan
― 7 minilectura