Los investigadores mejoran la detección del habla generada por máquinas usando ajustes en la información de fase.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Los investigadores mejoran la detección del habla generada por máquinas usando ajustes en la información de fase.
― 7 minilectura
Un nuevo marco mejora el estudio de los sistemas de reconocimiento de voz no supervisados.
― 8 minilectura
El nuevo modelo LinDiff mejora la velocidad y calidad de la síntesis de voz.
― 5 minilectura
Investigadores combinan características visuales y sonoras para mejorar el habla de los usuarios de electrolaringe.
― 6 minilectura
Esta investigación resalta cómo los LLMs mejoran la comprensión del habla en videos largos.
― 5 minilectura
Un nuevo método optimiza los modelos de voz para un mejor rendimiento con menos recursos.
― 6 minilectura
EM-Network mejora el aprendizaje de secuencias en tareas de procesamiento de habla y lenguaje.
― 6 minilectura
Este estudio evalúa varios modelos para predecir la calidad del habla sintetizada.
― 6 minilectura
Este artículo habla sobre cómo mejorar el reconocimiento de voz usando métodos de conjunto basados en confianza.
― 6 minilectura
GenerTTS mejora la tecnología de texto a voz para aplicaciones multilingües.
― 6 minilectura
Un nuevo modelo mejora la extracción de voz de fondos ruidosos usando aprendizaje profundo.
― 5 minilectura
Un estudio sobre cómo mejorar la reproducción del sonido vocal con técnicas de síntesis avanzadas.
― 7 minilectura
Nuevos métodos buscan ocultar las identidades de los hablantes mientras mantienen la claridad del habla.
― 6 minilectura
Un nuevo método para mejorar la calidad del habla usando redes eficientes en energía.
― 6 minilectura
Los investigadores analizan cómo se comparten las emociones a través del habla usando datos diversos.
― 7 minilectura
Nuevos métodos mejoran la calidad del habla sintética usando aprendizaje auto-supervisado.
― 6 minilectura
El Aprendizaje Federado mejora el reconocimiento de voz mientras mantiene los datos del usuario privados.
― 6 minilectura
Un nuevo método mejora la detección de emociones en el habla usando solo audio.
― 6 minilectura
O-1 mejora el reconocimiento de voz al optimizar métodos de autoentrenamiento.
― 6 minilectura
La investigación destaca métodos de detección en tiempo real para audio falso creado por IA.
― 6 minilectura
Nuevos métodos de poda mejoran el rendimiento del modelo de texto a voz de múltiples hablantes sin entrenamiento previo.
― 9 minilectura
Nuevos métodos para seleccionar datos de voz minimizan el etiquetado mientras mejoran la precisión del reconocimiento.
― 6 minilectura
Un nuevo método mejora la clasificación de calidad del habla utilizando puntuaciones de preferencia de los oyentes.
― 6 minilectura
Un método para mejorar los sistemas de ASR para usuarios que tartamudean.
― 6 minilectura
Nuevos métodos de un solo paso mejoran la precisión en el seguimiento de formantes para los sonidos del habla.
― 5 minilectura
Un nuevo enfoque mejora la integración del habla con los modelos de lenguaje.
― 8 minilectura
Examinando cómo los modelos de lenguaje preentrenados mejoran la calidad del texto a voz.
― 7 minilectura
El MuLanTTS de Microsoft ofrece capacidades de texto a voz en francés que suenan naturales y expresivas.
― 5 minilectura
Un proyecto tiene como objetivo mejorar el procesamiento del habla en francés usando aprendizaje auto-supervisado.
― 6 minilectura
Nuevos métodos mejoran cómo las máquinas reconocen el ritmo y la emoción del habla.
― 8 minilectura
Este estudio mejora la capacidad de los sistemas de reconocimiento de voz para entender el habla de los niños.
― 7 minilectura
VoxtLM combina reconocimiento de voz, síntesis, generación de texto y continuación en un solo modelo.
― 5 minilectura
Libriheavy ofrece 50,000 horas de inglés hablado para mejorar la tecnología de reconocimiento de voz.
― 6 minilectura
AV2Wav mejora la calidad del habla usando pistas de audio y visuales.
― 6 minilectura
La selección de core-set mejora los modelos de texto a voz al centrarse en datos diversos.
― 6 minilectura
Nuevo método preserva el tono emocional en la conversión de voz para mejorar la interacción humano-computadora.
― 7 minilectura
La investigación revela que el habla emocional afecta el rendimiento del modelo en tareas de separación de voz.
― 8 minilectura
La investigación combina aprendizaje auto-supervisado y nuevas técnicas de medición para mejorar la inversión del habla.
― 7 minilectura
Los investigadores desarrollan un nuevo marco para mejorar la claridad del habla para los usuarios de electrolaringe.
― 6 minilectura
Un nuevo método utiliza datos sintéticos para mejorar los sistemas de ASR en áreas desconocidas.
― 7 minilectura