Un enfoque novedoso mejora el aprendizaje automático con menos ejemplos y datos multimodales.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un enfoque novedoso mejora el aprendizaje automático con menos ejemplos y datos multimodales.
― 7 minilectura
Un nuevo método para estimar las respuestas de las habitaciones en entornos sonoros complejos.
― 8 minilectura
Un nuevo método para la conversión de voz mejora la claridad y la adaptación.
― 7 minilectura
Construyendo sistemas de TTS para lenguas turcas menos conocidas usando datos en kazajo.
― 6 minilectura
MeLoDy genera rápidamente música de alta calidad a partir de textos.
― 6 minilectura
Emergen nuevos métodos para proteger el reconocimiento de voz de ataques adversarios.
― 6 minilectura
AudioDec ofrece audio de alta calidad en tiempo real con bajo consumo de datos.
― 6 minilectura
Una nueva técnica verifica la exposición a datos de entrenamiento en modelos de difusión.
― 6 minilectura
Un nuevo modelo mejora el aislamiento de voz en entornos ruidosos.
― 6 minilectura
Este artículo habla de cómo recrear el sonido de la cinta magnética usando tecnología digital.
― 7 minilectura
Nuevo marco mejora la calidad de generación de voz en la síntesis de habla.
― 6 minilectura
Los investigadores desarrollan tecnología para recrear voces únicas para quienes tienen dificultades para hablar.
― 6 minilectura
Un nuevo método mejora la verificación de hablantes al combinar la destilación de conocimientos y el ajuste fino.
― 8 minilectura
DeCoR ayuda a las máquinas a aprender nuevos sonidos sin olvidar los viejos.
― 6 minilectura
Los transformadores de audio en streaming mejoran la velocidad y la eficiencia en los sistemas de etiquetado de audio.
― 7 minilectura
Nuevas técnicas mejoran la precisión y la velocidad en convertir voz a texto.
― 7 minilectura
Esta investigación presenta evaluaciones mejoradas para una comunicación más clara en personas con disartria.
― 6 minilectura
Un nuevo método mejora el reconocimiento de voz para nombres que suenan parecido.
― 6 minilectura
Un nuevo método mejora la naturalidad y variedad de la salida de texto a voz.
― 6 minilectura
El adaptador Treff mejora la clasificación de audio con datos etiquetados limitados.
― 6 minilectura
Nuevos métodos mejoran la flexibilidad y el rendimiento del modelo en tareas de audio.
― 5 minilectura
La investigación destaca métodos efectivos para reconocer emociones en el habla utilizando embeddings.
― 7 minilectura
Descubre cómo los E-PANNs mejoran la eficiencia en el reconocimiento de sonido.
― 6 minilectura
Esta investigación analiza dialectos usando grabaciones de audio para revelar sus similitudes.
― 6 minilectura
Un nuevo método mejora la comprensión del lenguaje hablado sin necesitar transcripciones escritas.
― 6 minilectura
Un nuevo método mejora la clasificación de audio al aprender nuevos sonidos de manera eficiente.
― 5 minilectura
Nuevo método mejora la adaptación de TTS con requisitos de datos mínimos.
― 7 minilectura
Una visión general de los métodos de IA explicable en el reconocimiento automático de voz.
― 7 minilectura
Un nuevo modelo mejora la forma en que las máquinas entienden y responden a preguntas de audio.
― 7 minilectura
La investigación destaca la necesidad de mejorar el turno de palabra en la tecnología TTS.
― 7 minilectura
BabySLM evalúa qué tan bien las máquinas aprenden a entender el habla según el lenguaje de los niños.
― 8 minilectura
Un nuevo método mejora la selección de voz sintética para aumentar la precisión del sistema ASR.
― 7 minilectura
Un nuevo método alinea el habla sin fluidez con el texto de manera eficiente.
― 6 minilectura
Mejorando sistemas para el reconocimiento de voz silenciosa con nuevas técnicas.
― 6 minilectura
Nuevos métodos mejoran el reconocimiento automático de voz para palabras raras usando contexto.
― 7 minilectura
Un nuevo método para entrenar modelos de detección de palabras clave usando supervisión débil en entornos ruidosos.
― 7 minilectura
Métodos para mejorar los sistemas de traducción de habla para lenguas subrepresentadas.
― 5 minilectura
MERT aborda los desafíos del modelado musical a través de técnicas innovadoras de aprendizaje auto-supervisado.
― 7 minilectura
Un nuevo enfoque mejora el rendimiento de RNN-T en el reconocimiento automático del habla.
― 8 minilectura
El modelo AVLIT combina sonido y video para mejorar la claridad del habla en entornos ruidosos.
― 7 minilectura