Un nuevo método mejora la detección de tartamudeo combinando datos de audio, video y texto.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo método mejora la detección de tartamudeo combinando datos de audio, video y texto.
― 7 minilectura
La investigación presenta nuevos métodos para evaluar sistemas de reconocimiento de voz en polaco.
― 7 minilectura
Un nuevo conjunto de datos mejora el habla de máquina para el mandarín, buscando una expresión más natural.
― 7 minilectura
Explora la creciente importancia de la edición de audio para creadores de contenido.
― 7 minilectura
Nuevos métodos mejoran los sistemas de voz para lenguas poco representadas.
― 6 minilectura
La investigación combina la mejora del habla y el aprendizaje por transferencia para mejores sistemas anti-spoofing.
― 9 minilectura
Nuevos métodos mejoran la expresión emocional en la síntesis de voz de máquinas.
― 8 minilectura
Speech-MASSIVE busca mejorar la comprensión del lenguaje hablado en varios idiomas.
― 7 minilectura
Técnicas innovadoras protegen datos de voz sensibles mientras mantienen la precisión del procesamiento.
― 8 minilectura
OpenOmni crea herramientas flexibles para hacer y probar agentes de conversación.
― 9 minilectura
SSL-TTS simplifica la síntesis de voz usando pocos datos de entrenamiento para obtener resultados de alta calidad.
― 7 minilectura
Nuevos métodos mejoran el reconocimiento de voz para la comunicación susurrada.
― 7 minilectura
StyleSpeech mejora los sistemas de TTS al captar los matices del habla natural.
― 7 minilectura
EmoAttack usa conversión de voz emocional para aprovechar vulnerabilidades en sistemas de habla.
― 6 minilectura
Un nuevo método mejora la conversión de susurros a habla normal usando técnicas avanzadas.
― 6 minilectura
VoxInstruct combina contenido y estilo para una generación de habla más natural.
― 6 minilectura
Un nuevo método mejora la precisión del reconocimiento de voz en varios idiomas.
― 6 minilectura
Explorando un nuevo enfoque para mejorar la calidad del habla usando ventanas de contexto temporal.
― 7 minilectura
Nuevos métodos mejoran la calidad de la síntesis de voz en sistemas TTS.
― 5 minilectura
SelectTTS simplifica la generación de voz para hablantes desconocidos con una selección de cuadros efectiva.
― 6 minilectura
Un nuevo método mejora el rendimiento del modelo de habla en varias tareas.
― 7 minilectura
Un nuevo método mejora la precisión de la detección de palabras clave usando datos de audio sin etiquetar.
― 8 minilectura
Investigaciones muestran que el análisis del habla puede ayudar en la detección temprana del deterioro cognitivo leve.
― 6 minilectura
Los investigadores crean LibriheavyMix para mejorar el reconocimiento de voz en entornos ruidosos.
― 6 minilectura
Un nuevo punto de referencia ayuda a evaluar los tokenizadores de habla para un mejor rendimiento.
― 7 minilectura
Un nuevo método aprovecha datos de voz para mejorar las evaluaciones de autismo.
― 7 minilectura
Descubre cómo DDSP mejora la eficiencia y calidad de la síntesis de voz.
― 7 minilectura
Los modelos de lenguaje de habla tienen potencial, pero les cuesta identificar a los hablantes en las conversaciones.
― 5 minilectura
Este artículo habla sobre métodos de entrenamiento eficientes para modelos de voz usando aprendizaje auto-supervisado.
― 5 minilectura
Un nuevo conjunto de datos mejora la tecnología de habla multilingüe en India.
― 7 minilectura
ParaEVITS mejora la expresión emocional en TTS a través de la guía del lenguaje natural.
― 6 minilectura
Esfuerzos para mejorar la tecnología de voz para el idioma Faetar, que tiene pocos recursos.
― 6 minilectura
Un nuevo modelo combina el reconocimiento de voz y el reconocimiento de entidades para obtener mejores resultados.
― 6 minilectura
Un proyecto busca mejorar la tecnología de voz para quienes tienen dificultades de comunicación.
― 6 minilectura
Un nuevo sistema mejora la precisión del acento en TTS para una mejor comunicación.
― 6 minilectura
Una herramienta fácil de usar para ajustar modelos de voz sin necesidad de código complicado.
― 7 minilectura
Un nuevo método que mejora el reconocimiento de voz mientras asegura la privacidad de los datos.
― 6 minilectura
Un nuevo método para generar habla acentuada usando transliteración de texto.
― 7 minilectura
Wave-U-Mamba mejora grabaciones de voz de baja calidad para una comunicación más clara.
― 6 minilectura
Un nuevo sistema predice las puntuaciones de naturalidad para el habla sintética usando métodos innovadores.
― 7 minilectura