Nuevo modelo consigue una transcripción de voz más rápida sin sacrificar la precisión.
Yael Segal-Feldman, Aviv Shamsian, Aviv Navon
― 5 minilectura
Ciencia de vanguardia explicada de forma sencilla
Nuevo modelo consigue una transcripción de voz más rápida sin sacrificar la precisión.
Yael Segal-Feldman, Aviv Shamsian, Aviv Navon
― 5 minilectura
Descubre cómo los embeddings Matryoshka mejoran la eficiencia y flexibilidad del reconocimiento de hablantes.
Shuai Wang, Pengcheng Zhu, Haizhou Li
― 6 minilectura
Te presentamos NanoVoice, un modelo de texto a voz rápido y eficiente para audio personalizado.
Nohil Park, Heeseung Kim, Che Hyun Lee
― 6 minilectura
El nuevo modelo VoiceGuider mejora el TTS para diferentes hablantes.
Jiheum Yeom, Heeseung Kim, Jooyoung Choi
― 7 minilectura
Un nuevo método para convertir voces entre idiomas manteniendo las características únicas.
Giuseppe Ruggiero, Matteo Testa, Jurgen Van de Walle
― 6 minilectura
Nuevas técnicas mejoran la calidad del habla expresiva entre diferentes hablantes.
Lucas H. Ueda, Leonardo B. de M. M. Marques, Flávio O. Simões
― 6 minilectura
Este artículo explora el papel de las métricas perceptuales en la clasificación de géneros musicales.
Tashi Namgyal, Alexander Hepburn, Raul Santos-Rodriguez
― 6 minilectura
Un nuevo método mejora el procesamiento de voz y audio en varias tareas.
Xiaoyu Yang, Qiujia Li, Chao Zhang
― 6 minilectura
Un nuevo sistema mejora la identificación de los hablantes en discusiones con varios participantes.
Ruoyu Wang, Shutong Niu, Gaobin Yang
― 6 minilectura
Un nuevo marco mejora la expresión emocional en los sistemas TTS.
Kun Zhou, You Zhang, Shengkui Zhao
― 6 minilectura
Hallazgos recientes revelan que los sensores de presión se pueden usar para espiar.
Yonatan Gizachew Achamyeleh, Mohamad Habib Fakih, Gabriel Garcia
― 5 minilectura
Un nuevo algoritmo mejora la detección de eventos sonoros usando aprendizaje auto-supervisado.
Pengfei Cai, Yan Song, Nan Jiang
― 6 minilectura
La investigación se centra en mejorar los métodos para detectar discursos falsos realistas.
Davide Salvi, Viola Negroni, Luca Bondi
― 6 minilectura
Un nuevo método simplifica la creación de audio y video para una mejor sincronización.
Masato Ishii, Akio Hayakawa, Takashi Shibuya
― 7 minilectura
Controla los efectos de audio usando descripciones simples para hacer ajustes de sonido más fáciles.
Annie Chu, Patrick O'Reilly, Julia Barnett
― 6 minilectura
Presentamos un nuevo modelo y benchmark para evaluar tareas de audio múltiple.
Yiming Chen, Xianghu Yue, Xiaoxue Gao
― 7 minilectura
Un nuevo sistema modela la intensidad emocional en personajes animados para un realismo mejorado.
Jingyi Xu, Hieu Le, Zhixin Shu
― 7 minilectura
OpenSep automatiza la separación de audio para experiencias sonoras más claras sin necesidad de intervención manual.
Tanvir Mahmud, Diana Marculescu
― 7 minilectura
PALM mejora el reconocimiento de audio al optimizar la representación de los mensajes y la eficiencia.
Asif Hanif, Maha Tufail Agro, Mohammad Areeb Qazi
― 5 minilectura
Explora cómo los giros y el grosor del alambre impactan el sonido de las pastillas de guitarra.
Charles Batchelor, Jack Gooding, William Marriott
― 9 minilectura
Un nuevo método mejora el reconocimiento de voz para grabaciones largas.
Hao Yen, Shaoshi Ling, Guoli Ye
― 6 minilectura
Este estudio analiza cómo el audio, el video y el texto funcionan juntos en el reconocimiento de voz.
Chen Chen, Xiaolou Li, Zehua Liu
― 8 minilectura
Un nuevo modelo mejora la naturalidad en los sistemas de texto a voz analizando los patrones de tono.
Tomilov A. A., Gromova A. Y., Svischev A. N
― 5 minilectura
Un nuevo modelo mejora la representación del habla para las lenguas africanas, aumentando la inclusión en la tecnología.
Jesujoba O. Alabi, Xuechen Liu, Dietrich Klakow
― 5 minilectura
Un nuevo modelo mejora la creación musical usando melodía y descripciones de texto.
Shaopeng Wei, Manzhen Wei, Haoyu Wang
― 6 minilectura
Nuevo método para modelos de lenguaje de voz reduce la necesidad de grandes cantidades de datos.
Ke-Han Lu, Zhehuai Chen, Szu-Wei Fu
― 7 minilectura
Aprende cómo funciona la conversión de voz y sus aplicaciones emocionantes.
Arip Asadulaev, Rostislav Korst, Vitalii Shutov
― 5 minilectura
Descubre cómo CCI mejora las evaluaciones de calidad multimedia.
Alessandro Ragano, Helard Becerra Martinez, Andrew Hines
― 7 minilectura
Los investigadores combinan señales de audio y visuales para detectar mentiras con más precisión.
Abdelrahman Abdelwahab, Akshaj Vishnubhatla, Ayaan Vaswani
― 7 minilectura
Una nueva red basada en voz cierra las brechas de idioma en emergencias.
Majid Behravan, Elham Mohammadrezaei, Mohamed Azab
― 6 minilectura
Aprende cómo los asistentes virtuales entienden mejor los comandos de los usuarios.
Ognjen, Rudovic, Pranay Dighe
― 7 minilectura
MACE mejora la subtitulación de audio al conectar sonidos con descripciones de texto precisas.
Satvik Dixit, Soham Deshmukh, Bhiksha Raj
― 6 minilectura
Usando machine learning para predecir la reacción del público a las versiones de canciones.
Aris J. Aristorenas
― 8 minilectura
Un nuevo enfoque para mejorar la clasificación a través de la Pérdida de Distribución de Distancia Angular.
Antonio Almudévar, Romain Serizel, Alfonso Ortega
― 7 minilectura
Nuevos métodos mejoran las herramientas de comunicación para personas con dificultades de habla.
Macarious Hui, Jinda Zhang, Aanchan Mohan
― 8 minilectura
Nuevos métodos con modelos de lenguaje mejoran la detección de sonido en medio del ruido de fondo.
Han Yin, Yang Xiao, Jisheng Bai
― 7 minilectura
Fish-Speech mejora la tecnología de voz para una experiencia de comunicación más natural.
Shijia Liao, Yuxuan Wang, Tianyu Li
― 6 minilectura
EmoSphere++ permite que las máquinas expresen emociones como los humanos, mejorando las interacciones.
Deok-Hyeon Cho, Hyung-Seok Oh, Seung-Bin Kim
― 8 minilectura
U-COTANS mejora la detección de límites submarinos usando técnicas de deep learning.
Toros Arikan, Luca M. Chackalackal, Fatima Ahsan
― 7 minilectura
PIAST ofrece una colección única de música de piano para investigadores.
Hayeon Bang, Eunjin Choi, Megan Finch
― 6 minilectura