ParaEVITS mejora la expresión emocional en TTS a través de la guía del lenguaje natural.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
ParaEVITS mejora la expresión emocional en TTS a través de la guía del lenguaje natural.
― 6 minilectura
Aprende cómo la inpainting de audio restaura partes faltantes de las señales.
― 6 minilectura
Nuevos métodos mejoran la comprensión del lenguaje hablado a través de un conjunto de datos innovador.
― 5 minilectura
Un nuevo marco mejora la precisión en la confirmación de la identidad vocal.
― 7 minilectura
Nuevos métodos mejoran la conversación entre humanos y robots al aumentar la claridad del habla.
― 6 minilectura
Nuevos métodos mejoran el acceso a noticias habladas al segmentar mejor los temas.
― 8 minilectura
Un estudio sobre las capacidades de los LLMs para entender intervalos musicales, acordes y escalas.
― 10 minilectura
Un nuevo método para etiquetar música usando aprendizaje de pocos ejemplos muestra resultados prometedores.
― 7 minilectura
FlowSep presenta un nuevo método para extraer sonidos usando consultas de lenguaje.
― 6 minilectura
SSR-Speech ofrece nuevas soluciones para la generación y edición de voz.
― 5 minilectura
Los avances en IA hacen que el audio falso sea común, lo que genera la necesidad de detección.
― 7 minilectura
Nuevo modelo mejora la generación de voz en diversos dialectos de lenguas con acento tonal.
― 6 minilectura
Un nuevo método mejora la precisión de la localización sonora y asegura la privacidad de los datos.
― 5 minilectura
SoloAudio mejora la extracción de sonido usando técnicas avanzadas y datos sintéticos.
― 6 minilectura
OpenACE ofrece un punto de referencia justo para evaluar códecs de audio en distintas condiciones.
― 6 minilectura
Un método para identificar fallos en motores eléctricos a través del análisis de sonido y redes neuronales bayesianas.
― 6 minilectura
Los modelos de reconocimiento de voz están evolucionando con la predicción de múltiples tokens para respuestas más rápidas.
― 6 minilectura
Esfuerzos para mejorar la tecnología de voz para el idioma Faetar, que tiene pocos recursos.
― 6 minilectura
Un nuevo método de zero-shot mejora la precisión de la conversión de voz y minimiza la filtración de sonido.
― 6 minilectura
Un estudio revela cómo cambian los tonos en el habla cotidiana del mandarín taiwanés.
― 6 minilectura
Nuevo enfoque mejora la isolación de voz en ambientes de audio mixto usando tokens discretos.
― 6 minilectura
La investigación relaciona pinturas con música al interpretar emociones.
― 7 minilectura
Un nuevo método mejora la detección automática de problemas del habla relacionados con la enfermedad de Parkinson.
― 5 minilectura
Un nuevo enfoque mejora los sistemas de ASR para una mejor comunicación en el aula.
― 5 minilectura
Este artículo explora cómo diferentes entradas pueden mejorar la precisión del reconocimiento de voz.
― 6 minilectura
Un sistema que hace que crear música sea fácil y accesible para todos los niveles de habilidad.
― 8 minilectura
ReCLAP mejora la clasificación de audio con indicaciones detalladas para una mejor precisión.
― 6 minilectura
Un proyecto busca mejorar la tecnología de voz para quienes tienen dificultades de comunicación.
― 6 minilectura
MambaFoley revoluciona la síntesis de sonido Foley con un mejor timing y realismo.
― 6 minilectura
Un nuevo sistema mejora la precisión del acento en TTS para una mejor comunicación.
― 6 minilectura
Usar embeddings de CLAP mejora mucho los sistemas de recomendación de música.
― 8 minilectura
Un estudio explora el desarrollo de ASR para Amis y Seediq, centrándose en el uso de datos.
― 8 minilectura
Los investigadores desarrollan nuevas estrategias para distinguir a los animales individuales usando sus sonidos únicos.
― 6 minilectura
Un nuevo método simplifica la detección de sirenas para mejorar la seguridad de los vehículos.
― 6 minilectura
Un nuevo enfoque combina la detección de eventos sonoros y la diarización de hablantes para una mejor comprensión del audio.
― 6 minilectura
Un nuevo enfoque mejora el ASR al centrarse en detalles específicos del hablante.
― 6 minilectura
Un estudio que revela cómo los modelos de deep learning reconocen emociones en el habla.
― 6 minilectura
Una herramienta fácil de usar para ajustar modelos de voz sin necesidad de código complicado.
― 7 minilectura
Nuevos métodos mejoran el aislamiento acústico de entornos ruidosos sin necesidad de datos etiquetados.
― 6 minilectura
Un nuevo enfoque aborda la variación de canal en los sistemas de reconocimiento de voz.
― 7 minilectura