Un nuevo modelo mejora el reconocimiento de voz en conversaciones multilingües.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo modelo mejora el reconocimiento de voz en conversaciones multilingües.
― 7 minilectura
Este estudio examina la efectividad de los LLMs en musicología y su fiabilidad.
― 7 minilectura
Este estudio examina cómo el ruido puede mejorar la resistencia del reconocimiento del habla frente a desafíos.
― 6 minilectura
Descubre cómo un micrófono extra mejora la detección de dirección del sonido en entornos ruidosos.
― 6 minilectura
Un nuevo método mejora la conversión de voz usando menos muestras.
― 6 minilectura
Un transductor innovador y liviano mejora la eficiencia y precisión del reconocimiento de voz.
― 7 minilectura
Nuevos métodos mejoran la creación musical a través del análisis de audio y el control del usuario.
― 8 minilectura
Nuevos métodos de marca de agua protegen a los creadores en modelos generativos de audio.
― 5 minilectura
Descubre cómo DDSP mejora la eficiencia y calidad de la síntesis de voz.
― 7 minilectura
Este estudio mejora el SER a través de un mejor procesamiento previo y modelos de atención eficientes.
― 6 minilectura
Un marco para ajustar la música en tiempo real en juegos y películas.
― 6 minilectura
aTENNuate ofrece una mejora eficiente en tiempo real de las señales de voz, mejorando la claridad de la comunicación.
― 6 minilectura
Los investigadores exploran ecos ultrasónicos para medir distancias de manera precisa en entornos interiores tranquilos.
― 7 minilectura
Las técnicas de anonimización de hablantes protegen la información personal mientras mantienen la claridad en la comunicación.
― 7 minilectura
Nuevos métodos mejoran la claridad del sonido en ambientes ruidosos para dispositivos de audio.
― 5 minilectura
Un nuevo modelo mejora la separación vocal y la transcripción de melodías en la música.
― 6 minilectura
La investigación revela cómo las neuronas en los modelos de habla reconocen las características clave del sonido.
― 8 minilectura
Un nuevo modelo simplifica la producción de audio al eliminar automáticamente los sonidos de respiración.
― 7 minilectura
Los modelos de lenguaje de habla tienen potencial, pero les cuesta identificar a los hablantes en las conversaciones.
― 5 minilectura
Un enfoque de aprendizaje auto-supervisado reduce la necesidad de datos de audio etiquetados.
― 7 minilectura
Un estudio revela el papel de los datos de voz en el reconocimiento de emociones en hablantes de español.
― 6 minilectura
Un nuevo método mejora la claridad del habla en entornos ruidosos.
― 5 minilectura
Enfoques innovadores buscan mejorar la calidad de la música para quienes tienen pérdida auditiva.
― 7 minilectura
GenRep ofrece un enfoque novedoso para identificar sonidos inusuales de máquinas con datos limitados.
― 6 minilectura
TF-Mamba mejora la localización del sonido usando un enfoque novedoso que integra datos de tiempo y frecuencia.
― 6 minilectura
La investigación sobre sistemas ASR modulares busca mejorar el rendimiento en entornos ruidosos.
― 5 minilectura
Un nuevo método combina el significado y el sonido para mejorar la detección de emociones en el habla.
― 8 minilectura
Este artículo habla sobre métodos de entrenamiento eficientes para modelos de voz usando aprendizaje auto-supervisado.
― 5 minilectura
Una nueva arquitectura mejora la detección de sonido en diferentes entornos.
― 6 minilectura
Un nuevo modelo mejora la generación de música enfocándose en instrumentos individuales.
― 6 minilectura
Te presentamos DENSE, un método que mejora la extracción de habla objetivo usando embeddings dinámicos.
― 7 minilectura
Un nuevo método mejora la transformación de audio mientras preserva la melodía y la calidad del sonido.
― 7 minilectura
Este método mejora la precisión del reconocimiento para nombres poco comunes en las salidas de voz.
― 7 minilectura
Mejorando la identificación de palabras habladas a través de señales visuales en idiomas con pocos recursos.
― 8 minilectura
Un nuevo modelo mejora la detección de deepfakes de audio con aprendizaje continuo.
― 6 minilectura
Una visión general de métodos, desafíos y sistemas de diarización de altavoces audiovisuales.
― 6 minilectura
BigCodec mejora la calidad de sonido en la transmisión de audio a baja tasa de bits.
― 6 minilectura
Un nuevo método mejora la captura de sonido usando micrófonos circulares para una mejor calidad de audio.
― 6 minilectura
Este artículo habla sobre los beneficios de simplificar modelos de transformers para tareas de voz.
― 5 minilectura
Sortformer integra diarización de hablantes y ASR para mejorar el procesamiento de audio.
― 6 minilectura