Este artículo habla de un método para mejorar los subtítulos de video incorporando audio.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Este artículo habla de un método para mejorar los subtítulos de video incorporando audio.
― 7 minilectura
Un nuevo modelo mejora la conversión de voz al simplificar las técnicas de separación del habla.
― 8 minilectura
La investigación busca combinar datos de audio y simbólicos para analizar la similitud musical.
― 9 minilectura
Nuevos métodos mejoran la segmentación del habla en conversaciones multilingües.
― 8 minilectura
NoisyILRMA mejora la extracción de sonido del ruido de fondo para tener experiencias de audio más claras.
― 5 minilectura
Este artículo habla sobre el papel del aprendizaje auto-supervisado en la tecnología musical.
― 6 minilectura
Los sistemas ASR personalizados mejoran la comunicación para personas DHH de manera significativa.
― 7 minilectura
Nuevos métodos aprovechan resúmenes conversacionales para mejorar el reconocimiento de hablantes.
― 7 minilectura
Mejorando los sistemas de retroalimentación para los que aprenden inglés al abordar el problema del arranque en frío.
― 7 minilectura
Investigando métodos para localizar fuentes de sonido de los aerogeneradores para reducir el ruido.
― 5 minilectura
Presentamos un nuevo modelo para identificar técnicas de canto en pistas de audio.
― 7 minilectura
Un nuevo modelo mejora la extracción de voz usando información de audio y visual.
― 7 minilectura
Wespeaker simplifica el reconocimiento de hablantes con herramientas fáciles de usar y modelos preentrenados.
― 7 minilectura
Un nuevo método transforma señales mono en experiencias estéreo interesantes.
― 7 minilectura
Un estudio sobre cómo mejorar la detección de emociones en el habla para grupos diversos.
― 6 minilectura
Un estudio usa un dispositivo de múltiples datos para seguir los patrones de sueño de los bebés de manera más precisa.
― 5 minilectura
3D-Speaker ofrece una gran colección de grabaciones de audio para un análisis de voz avanzado.
― 6 minilectura
GenerTTS mejora la tecnología de texto a voz para aplicaciones multilingües.
― 6 minilectura
Un nuevo sistema mejora la detección de audio manipulado a través de técnicas innovadoras.
― 6 minilectura
Mejorar el reconocimiento de voz para voces superpuestas hace que sea más fácil de usar en diferentes situaciones.
― 6 minilectura
Nuevos métodos mejoran la separación de voces en entornos de audio mezclados.
― 6 minilectura
Descubre cómo nuevas técnicas mejoran la claridad del habla en entornos ruidosos.
― 6 minilectura
Un nuevo método para hacer que la síntesis de voz sea más personal usando menos datos de voz.
― 6 minilectura
Nuevos métodos mejoran la localización del sonido usando arreglos de micrófonos distribuidos.
― 6 minilectura
Este estudio examina métodos para proteger la privacidad al analizar conversaciones habladas.
― 7 minilectura
Los recientes ataques por backdoor exponen riesgos en las tecnologías de identificación por voz.
― 9 minilectura
Un nuevo modelo mejora la extracción de voz de fondos ruidosos usando aprendizaje profundo.
― 5 minilectura
GOLF ofrece un enfoque nuevo para crear canto parecido al humano usando menos recursos.
― 7 minilectura
Investigación sobre cómo predecir la edad y el género a partir de datos de voz usando modelos innovadores.
― 5 minilectura
Un método fresco para entender las relaciones musicales a través de árboles de dependencia.
― 7 minilectura
Este artículo habla de nuevos modelos que mejoran la precisión del reconocimiento de voz al considerar contextos más largos.
― 7 minilectura
LyricWhiz combina modelos avanzados para mejorar la precisión de la transcripción de letras en diferentes idiomas.
― 7 minilectura
Un estudio sobre cómo usar grabaciones de sonido para identificar diferentes especies de aves en África.
― 7 minilectura
Descubre cómo los sistemas de recomendación sugieren canciones según las preferencias de los usuarios.
― 6 minilectura
Este artículo habla sobre los desafíos y técnicas para manejar el desequilibrio de conjuntos de datos en la clasificación de audio.
― 7 minilectura
Un nuevo enfoque mejora el reconocimiento de voz para el rumano usando inhibición lateral.
― 6 minilectura
La investigación destaca métodos para proteger la privacidad de género en audio hablado.
― 7 minilectura
Una mirada a cómo captar mejor las emociones detrás de las palabras habladas.
― 5 minilectura
Usar embeddings de audio preentrenados lleva a mejores modelos de clasificación musical.
― 8 minilectura
Nuevo marco mejora la claridad del habla en videos silenciosos mediante un procesamiento mejorado.
― 7 minilectura