Presentamos un método más rápido para la síntesis de voz de alta calidad usando modelos de difusión.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Presentamos un método más rápido para la síntesis de voz de alta calidad usando modelos de difusión.
― 7 minilectura
HiFTNet ofrece una síntesis de voz más rápida y de alta calidad usando técnicas innovadoras y eficientes.
― 6 minilectura
Explora cómo TTT mejora el reconocimiento de voz al adaptarse a cambios en la distribución.
― 8 minilectura
Un nuevo modelo mejora la eficiencia y el rendimiento en la separación de voces.
― 6 minilectura
Un estudio muestra que la augmentación de audio puede mejorar el reconocimiento de voz en lenguas con pocos recursos.
― 7 minilectura
Este estudio convierte datos de MRI de la lengua en audio de voz real.
― 5 minilectura
Un nuevo método mejora la eficiencia del reconocimiento de voz utilizando adaptación de bajo rango.
― 6 minilectura
Un nuevo estándar para mejorar la precisión del ASR usando modelos de lenguaje.
― 7 minilectura
Un nuevo enfoque para la generación de habla pequeña, eficiente y que suene natural.
― 11 minilectura
Un nuevo método integra información acústica en los modelos de lenguaje para mejorar el reconocimiento de voz.
― 10 minilectura
Un nuevo enfoque para sintetizar voces con una mejor precisión rítmica.
― 10 minilectura
Técnicas innovadoras para mejorar los modelos de TTS y reducir la pérdida de conocimiento.
― 7 minilectura
Este estudio revisa cómo el tamaño del lote influye en el rendimiento y entrenamiento del modelo de voz.
― 9 minilectura
Un nuevo método mejora el rendimiento y la eficiencia del modelo de voz en entornos ruidosos.
― 6 minilectura
Un estudio sobre cómo mejorar los sistemas de TTS con muestras de voz diversas.
― 5 minilectura
La investigación identifica y clasifica los dialectos kurdos sorani usando grabaciones de audio extensas.
― 7 minilectura
RALL-E mejora la síntesis de texto a voz para que suene más clara y natural.
― 6 minilectura
Nuevos métodos mejoran la representación de audio a través de técnicas de aprendizaje auto-supervisado.
― 7 minilectura
Nuevo modelo permite un control preciso de las cualidades de la voz mientras se mantiene el contenido.
― 5 minilectura
Un nuevo marco para evaluar modelos base en tareas de habla.
― 9 minilectura
Un estudio revela que los usuarios prefieren agentes de voz estáticos en lugar de adaptativos.
― 10 minilectura
FlashSpeech ofrece soluciones de síntesis de voz rápidas y de alta calidad.
― 8 minilectura
SEANet mejora el aislamiento del hablante al reducir el ruido en el procesamiento de audio.
― 8 minilectura
Un método de aprendizaje activo en dos etapas mejora la precisión del reconocimiento de voz con menos datos.
― 6 minilectura
Este estudio evalúa el rendimiento de los sistemas de ASR con personas que tartamudean.
― 10 minilectura
Este artículo investiga las vulnerabilidades en los modelos de voz y formas de mejorar su seguridad.
― 6 minilectura
Nuevos métodos mejoran cómo las máquinas reconocen emociones en el habla.
― 7 minilectura
Seed-TTS crea habla realista a partir de texto para varias aplicaciones.
― 5 minilectura
El nuevo modelo ARDiT mejora la síntesis de texto a voz y la edición de audio.
― 7 minilectura
mHuBERT-147 procesa el habla en varios idiomas de manera eficiente.
― 5 minilectura
Nuevos métodos mejoran el reconocimiento de voz en entornos ruidosos usando técnicas adaptativas.
― 8 minilectura
Un nuevo método que optimiza el análisis y la síntesis del habla usando los movimientos del tracto vocal.
― 8 minilectura
Un estudio sobre cómo mejorar la segmentación de audio integrando incrustaciones de hablante.
― 6 minilectura
Nuevos esfuerzos tienen como objetivo apoyar los dialectos yoruba en la tecnología del lenguaje.
― 6 minilectura
Este artículo habla sobre cómo Wav2Vec2.0 procesa los sonidos del habla usando fonología.
― 6 minilectura
Este estudio evalúa la tecnología de voz en lenguas de bajos recursos como el árabe tunecino.
― 6 minilectura
Mejorando la síntesis de voz para generar voces más naturales y expresivas.
― 6 minilectura
Presentamos un método para tener mejor control en la edición de audio.
― 6 minilectura
Emilia ofrece un conjunto de datos diverso para mejorar los modelos de generación de voz.
― 7 minilectura
Mamba promete mucho contra transformers en tareas de habla, especialmente con entradas largas.
― 5 minilectura