Los modelos de lenguaje de habla tienen potencial, pero les cuesta identificar a los hablantes en las conversaciones.
― 5 minilectura
Ciencia de vanguardia explicada de forma sencilla
Los modelos de lenguaje de habla tienen potencial, pero les cuesta identificar a los hablantes en las conversaciones.
― 5 minilectura
Un enfoque de aprendizaje auto-supervisado reduce la necesidad de datos de audio etiquetados.
― 7 minilectura
Un estudio revela el papel de los datos de voz en el reconocimiento de emociones en hablantes de español.
― 6 minilectura
Un nuevo método mejora la claridad del habla en entornos ruidosos.
― 5 minilectura
Enfoques innovadores buscan mejorar la calidad de la música para quienes tienen pérdida auditiva.
― 7 minilectura
GenRep ofrece un enfoque novedoso para identificar sonidos inusuales de máquinas con datos limitados.
― 6 minilectura
TF-Mamba mejora la localización del sonido usando un enfoque novedoso que integra datos de tiempo y frecuencia.
― 6 minilectura
La investigación sobre sistemas ASR modulares busca mejorar el rendimiento en entornos ruidosos.
― 5 minilectura
Un nuevo método combina el significado y el sonido para mejorar la detección de emociones en el habla.
― 8 minilectura
Este artículo habla sobre métodos de entrenamiento eficientes para modelos de voz usando aprendizaje auto-supervisado.
― 5 minilectura
Una nueva arquitectura mejora la detección de sonido en diferentes entornos.
― 6 minilectura
Un nuevo modelo mejora la generación de música enfocándose en instrumentos individuales.
― 6 minilectura
Te presentamos DENSE, un método que mejora la extracción de habla objetivo usando embeddings dinámicos.
― 7 minilectura
Un nuevo método mejora la transformación de audio mientras preserva la melodía y la calidad del sonido.
― 7 minilectura
Este método mejora la precisión del reconocimiento para nombres poco comunes en las salidas de voz.
― 7 minilectura
Mejorando la identificación de palabras habladas a través de señales visuales en idiomas con pocos recursos.
― 8 minilectura
Un nuevo modelo mejora la detección de deepfakes de audio con aprendizaje continuo.
― 6 minilectura
Una visión general de métodos, desafíos y sistemas de diarización de altavoces audiovisuales.
― 6 minilectura
BigCodec mejora la calidad de sonido en la transmisión de audio a baja tasa de bits.
― 6 minilectura
Un nuevo método mejora la captura de sonido usando micrófonos circulares para una mejor calidad de audio.
― 6 minilectura
Este artículo habla sobre los beneficios de simplificar modelos de transformers para tareas de voz.
― 5 minilectura
Sortformer integra diarización de hablantes y ASR para mejorar el procesamiento de audio.
― 6 minilectura
Un enfoque nuevo para crear sonidos de piano realistas usando separación de componentes de sonido.
― 9 minilectura
ParaEVITS mejora la expresión emocional en TTS a través de la guía del lenguaje natural.
― 6 minilectura
Aprende cómo la inpainting de audio restaura partes faltantes de las señales.
― 6 minilectura
Nuevos métodos mejoran la comprensión del lenguaje hablado a través de un conjunto de datos innovador.
― 5 minilectura
Nuevos métodos mejoran la conversación entre humanos y robots al aumentar la claridad del habla.
― 6 minilectura
Nuevos métodos mejoran el acceso a noticias habladas al segmentar mejor los temas.
― 8 minilectura
Esta investigación analiza el rendimiento de Mamba en tareas de habla, enfatizando la reconstrucción y el reconocimiento de sonidos.
― 6 minilectura
Un nuevo método para etiquetar música usando aprendizaje de pocos ejemplos muestra resultados prometedores.
― 7 minilectura
FlowSep presenta un nuevo método para extraer sonidos usando consultas de lenguaje.
― 6 minilectura
SSR-Speech ofrece nuevas soluciones para la generación y edición de voz.
― 5 minilectura
Los avances en IA hacen que el audio falso sea común, lo que genera la necesidad de detección.
― 7 minilectura
Nuevo modelo mejora la generación de voz en diversos dialectos de lenguas con acento tonal.
― 6 minilectura
Un nuevo método mejora la precisión de la localización sonora y asegura la privacidad de los datos.
― 5 minilectura
Un nuevo método para crear música pop estructurada usando técnicas basadas en grafos.
― 7 minilectura
Un nuevo método para mejorar la detección de palabras clave mientras se conserva el conocimiento aprendido.
― 6 minilectura
Los investigadores desarrollan un conjunto de datos para mejorar las técnicas de reconocimiento y análisis de voz.
― 7 minilectura
SoloAudio mejora la extracción de sonido usando técnicas avanzadas y datos sintéticos.
― 6 minilectura
OpenACE ofrece un punto de referencia justo para evaluar códecs de audio en distintas condiciones.
― 6 minilectura