Un robot móvil aprende a reconocer voces en entornos ruidosos para aplicaciones prácticas.
― 5 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un robot móvil aprende a reconocer voces en entornos ruidosos para aplicaciones prácticas.
― 5 minilectura
Un nuevo conjunto de datos busca mejorar la captura de voz usando sensores de conducción por el cuerpo.
― 7 minilectura
Un nuevo enfoque mejora la detección de deepfakes usando análisis audiovisual.
― 7 minilectura
Una mirada al progreso en las tecnologías y métodos de reconocimiento de voz.
― 6 minilectura
Un nuevo método mejora la detección de tartamudeo combinando datos de audio, video y texto.
― 7 minilectura
Un equipo mejora el procesamiento de audio para identificar hablantes y lenguajes.
― 5 minilectura
La investigación sobre la detección de emociones humanas a través del habla muestra potencial para varias aplicaciones.
― 6 minilectura
Un nuevo método mejora la creación de sonido para modelos humanos 3D realistas.
― 8 minilectura
Este estudio revela cómo el habla puede estimar las tasas de respiración usando modelos avanzados.
― 7 minilectura
GraphMuse simplifica el análisis de datos de música simbólica con técnicas avanzadas de aprendizaje automático.
― 6 minilectura
La investigación presenta nuevos métodos para evaluar sistemas de reconocimiento de voz en polaco.
― 7 minilectura
Este artículo habla sobre cómo mejorar el formato de expresión numérica en transcripciones automáticas.
― 6 minilectura
El aprendizaje auto-supervisado transforma el reconocimiento musical a través de métodos innovadores.
― 7 minilectura
Un nuevo conjunto de datos mejora el habla de máquina para el mandarín, buscando una expresión más natural.
― 7 minilectura
Un estudio sobre cómo mejorar la localización de fuentes de sonido aprovechando mejor la información auditiva y visual.
― 9 minilectura
Un nuevo marco analiza el habla para identificar el deterioro cognitivo leve en diferentes idiomas.
― 6 minilectura
Explorando el impacto de la IA en estilos musicales subrepresentados.
― 7 minilectura
Un método para mejorar los sistemas de TTS y que pronuncien mejor las palabras OOV en India.
― 6 minilectura
Un nuevo modelo mejora la eficiencia en el procesamiento del habla con menos consumo de energía.
― 5 minilectura
Nuevos modelos de aprendizaje automático mejoran la claridad del habla para usuarios de audífonos.
― 7 minilectura
La investigación explora audio de baja frecuencia para proteger la privacidad en estudios de comportamiento social.
― 7 minilectura
Explorando cómo se comporta el sonido en entornos de varias habitaciones y sus implicaciones en la tecnología.
― 7 minilectura
Nuevas herramientas de IA están simplificando la edición musical con técnicas innovadoras y mejor precisión.
― 6 minilectura
El emparejamiento de voz preestablecido mejora la traducción de voz mientras asegura la privacidad y reduce riesgos.
― 7 minilectura
Un nuevo sistema ayuda a los músicos a crear música con más control y precisión.
― 9 minilectura
Una nueva herramienta para evaluar la replicación en la música hecha por IA.
― 9 minilectura
Un nuevo modelo de texto a audio usando solo datos públicos.
― 6 minilectura
Un nuevo conjunto de datos busca mejorar la comprensión del cambio de código entre varios idiomas.
― 6 minilectura
Este artículo examina el equilibrio de género en los noticieros franceses en diferentes temas.
― 6 minilectura
El conjunto de datos Rasa mejora la conversión de texto a voz para idiomas indios con una voz neutra y expresiva.
― 7 minilectura
Nuevos métodos mejoran la comprensión de las emociones humanas en el habla por parte de las máquinas.
― 5 minilectura
Simplificar las herramientas de IA puede ayudar a los artistas a mejorar su expresión creativa.
― 6 minilectura
MusiConGen mejora el control del usuario en la generación de texto a música.
― 7 minilectura
Investigadores mejoran la decodificación del habla usando EEG para ayudar a quienes tienen dificultades para hablar.
― 8 minilectura
Un nuevo modelo mejora la claridad del habla al atacar el ruido y los ecos.
― 7 minilectura
J-CHAT ofrece un gran conjunto de datos de código abierto para mejorar los sistemas de diálogo hablado.
― 6 minilectura
Nuevos métodos permiten a los músicos crear instrumentos a partir de sonidos.
― 6 minilectura
Examinando cómo los códecs mantienen los tonos emocionales en los datos de voz.
― 7 minilectura
Descubre cómo la transmisión IP y el etiquetado de audio están transformando la entrega de contenido.
― 7 minilectura
Una mirada a cómo la tecnología y los músicos colaboran en una actuación única.
― 9 minilectura