LipVoicer genera un habla clara a partir de videos silenciosos usando métodos avanzados de lectura labial.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
LipVoicer genera un habla clara a partir de videos silenciosos usando métodos avanzados de lectura labial.
― 6 minilectura
Nuevos métodos buscan mejorar la comunicación para personas con disartria.
― 7 minilectura
Nuevo método mejora predicciones al considerar múltiples puntuaciones de expertos.
― 7 minilectura
Una mirada a cómo Whisper maneja varios dialectos y acentos árabes.
― 5 minilectura
Un programa que combina datos visuales y de audio para mejorar la comprensión de videos.
― 6 minilectura
Un nuevo método mejora el reconocimiento de actos de habla en bengalí usando análisis de audio y texto.
― 6 minilectura
La investigación explora el potencial de BERT en el análisis musical a nivel de bares.
― 6 minilectura
Un nuevo sistema mejora el aprendizaje de matemáticas en casa a través de interacciones divertidas.
― 7 minilectura
Un nuevo método mejora los modelos de reconocimiento de voz usando solo datos de texto para la adaptación.
― 7 minilectura
Un nuevo modelo mejora la armonización de melodías al considerar factores emocionales.
― 7 minilectura
Nuevos métodos usan onomatopeyas para inspirar movimientos de baile únicos.
― 6 minilectura
Los investigadores mejoran la detección del habla generada por máquinas usando ajustes en la información de fase.
― 7 minilectura
Un nuevo enfoque mejora la identificación del lenguaje hablado usando aprendizaje auto-supervisado y etiquetas.
― 7 minilectura
Un nuevo método mejora el reconocimiento de voz para hablantes árabes con disartria.
― 7 minilectura
Allophant mejora el reconocimiento de fonemas para idiomas con datos limitados.
― 6 minilectura
Te presentamos SANGEET, un conjunto de datos detallado sobre la música clásica hindustani.
― 5 minilectura
Un nuevo método busca mejorar la detección de audio falso sin perder el conocimiento previo.
― 7 minilectura
Un nuevo marco mejora el estudio de los sistemas de reconocimiento de voz no supervisados.
― 8 minilectura
Este proyecto ayuda a cualquiera a componer música usando ritmos básicos y métodos informáticos avanzados.
― 6 minilectura
Los modelos auto-supervisados revelan ideas sobre las distinciones fonéticas y fonémicas en el habla.
― 6 minilectura
La investigación explora el uso de reconocimiento de voz en el análisis de grabaciones de cámaras corporales de la policía.
― 8 minilectura
Una mirada a cómo las computadoras están cambiando la composición musical.
― 5 minilectura
Nuevas técnicas mejoran la comprensión emocional en tareas de procesamiento de habla.
― 7 minilectura
El nuevo modelo LinDiff mejora la velocidad y calidad de la síntesis de voz.
― 5 minilectura
Un nuevo enfoque para la compresión de audio reduce el tamaño del archivo sin perder calidad.
― 6 minilectura
Técnicas para mejorar el reconocimiento de voz en medio de ruido de fondo.
― 7 minilectura
HiddenSinger mejora la calidad de la voz cantando usando técnicas avanzadas de IA.
― 7 minilectura
Nuevos métodos mejoran la claridad del habla para usuarios de electrolaringes.
― 7 minilectura
Investigadores combinan características visuales y sonoras para mejorar el habla de los usuarios de electrolaringe.
― 6 minilectura
Un estudio destaca cómo el envejecimiento afecta el rendimiento de la verificación automática del hablante.
― 6 minilectura
PauseSpeech mejora los sistemas TTS con una voz que suena más natural gracias a pausas mejoradas.
― 6 minilectura
Esta investigación presenta un sistema para emparejar música con contenido de video de manera efectiva.
― 8 minilectura
Nuevos métodos mejoran el rendimiento del reconocimiento automático de voz en medio del ruido de fondo.
― 7 minilectura
Un nuevo método optimiza los modelos de voz para un mejor rendimiento con menos recursos.
― 6 minilectura
Un enfoque nuevo mejora cómo evaluamos la calidad del audio espacial.
― 6 minilectura
Un estudio sobre cómo distinguir entre el habla leída y la espontánea.
― 6 minilectura
Un nuevo modelo mejora el realismo del discurso sintético.
― 9 minilectura
Un nuevo modelo mejora la precisión y eficiencia en el seguimiento de fuentes de sonido.
― 6 minilectura
Un nuevo conjunto de datos mejora la comprensión del lenguaje hablado para el italiano.
― 7 minilectura
Nuevos métodos mejoran el reconocimiento de voz multilingüe usando fuentes de datos existentes.
― 8 minilectura