Informática - Sonido

RSS

Procesado de Audio y Voz Evaluando la calidad del habla con modelos XLS-R

Una mirada a cómo los modelos XLS-R mejoran la evaluación de la calidad de audio en reuniones en línea.

2025-09-22T01:31:30+00:00 ― 7 minilectura

Sonido Mejorando el etiquetado de audio con el marco CED

Un nuevo método mejora el rendimiento y la eficiencia en el etiquetado de audio.

2025-09-22T00:42:55+00:00 ― 6 minilectura

Sonido Nuevo estudio sobre la detección de voz generada por IA

La investigación destaca métodos de detección en tiempo real para audio falso creado por IA.

2025-09-21T19:02:50+00:00 ― 6 minilectura

Sonido Whombat: Una Nueva Herramienta para la Investigación Bioacústica

Whombat simplifica la anotación de grabaciones de sonido para la investigación de la vida salvaje.

2025-09-21T18:14:15+00:00 ― 6 minilectura

Sonido Avances en Técnicas de Mejora de Voz

Nuevas estrategias mejoran la claridad del habla en ambientes ruidosos para un mejor reconocimiento.

2025-09-21T17:25:40+00:00 ― 7 minilectura

Multimedia Vinculando emociones en imágenes con la búsqueda de música

Un nuevo sistema conecta imágenes emocionales con música para mejorar el descubrimiento.

2025-09-21T16:37:05+00:00 ― 7 minilectura

Sonido Mejorando la Calidad de la Música para Grabaciones Diarias

Un nuevo sistema mejora las grabaciones de audio para una mejor experiencia de escucha.

2025-09-21T15:48:30+00:00 ― 7 minilectura

Sonido Mejorando la bioacústica con técnicas de aprendizaje activo

Un nuevo enfoque reduce el etiquetado de datos mientras mejora la precisión en la clasificación de audio.

2025-09-21T14:11:20+00:00 ― 6 minilectura

Sonido Avances en la tecnología de texto a voz para un habla natural

Un nuevo sistema mejora la calidad del habla y la expresividad para la síntesis de párrafos.

2025-09-21T11:45:35+00:00 ― 6 minilectura

Sonido Evaluando la calidad de la música generada por IA

Descubre métodos para evaluar la calidad de la música creada por IA mediante evaluaciones subjetivas y objetivas.

2025-09-21T10:08:25+00:00 ― 6 minilectura

Sonido Nuevas ideas sobre el movimiento de la lengua al hablar

La investigación se centra en los movimientos de la lengua para ayudar en la terapia del habla y el aprendizaje de idiomas.

2025-09-21T04:28:20+00:00 ― 5 minilectura

Procesado de Audio y Voz Impacto de género en los sistemas biométricos de voz

Este estudio analiza cómo el género afecta la utilidad, privacidad y equidad de la biometría de voz.

2025-09-20T19:33:55+00:00 ― 8 minilectura

Sonido Mejorando la Síntesis de Voz con Técnicas de Poda

Nuevos métodos de poda mejoran el rendimiento del modelo de texto a voz de múltiples hablantes sin entrenamiento previo.

2025-09-20T15:31:00+00:00 ― 9 minilectura

Computación y lenguaje Entendiendo las Emociones en Conversaciones de Emergencia

La investigación sobre el reconocimiento de emociones en interacciones de llamadas de emergencia revela insights importantes.

2025-09-20T14:42:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en Aprendizaje Auto-Supervisado para el Reconocimiento de Voz

Nuevos métodos para seleccionar datos de voz minimizan el etiquetado mientras mejoran la precisión del reconocimiento.

2025-09-20T13:53:50+00:00 ― 6 minilectura

Sonido Avanzando el Reconocimiento de Emociones en el Habla con el Transformador Tiempo-Frecuencia

Un nuevo método mejora el reconocimiento de emociones en el habla al analizar el tiempo y la frecuencia.

2025-09-20T12:16:40+00:00 ― 6 minilectura

Física cuántica La tecnología cuántica se encuentra con la creación musical

Explora cómo las herramientas cuánticas transforman la producción musical para los artistas.

2025-09-20T08:57:42+00:00 ― 6 minilectura

Sonido Mejorando el Reconocimiento de Voz para Personas con Tartamudez

Un método para mejorar los sistemas de ASR para usuarios que tartamudean.

2025-09-20T06:36:35+00:00 ― 6 minilectura

Sonido Problemas de acceso en el conjunto de datos de un millón de canciones

Los desafíos para acceder a datos de audio dificultan las oportunidades de investigación.

2025-09-20T00:07:55+00:00 ― 6 minilectura

Sonido Avances en la Tecnología de Aislamiento de Voz

Nuevos métodos mejoran la claridad en entornos ruidosos a través de un procesamiento de sonido avanzado.

2025-09-19T22:30:45+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la tecnología de síntesis de voz francesa

Un sistema recién desarrollado genera un habla francesa realista para una competencia.

2025-09-19T21:42:10+00:00 ― 6 minilectura

Sonido Avances en la tecnología de detección de palabras clave

Nuevos métodos mejoran la eficiencia y precisión en los sistemas de reconocimiento de voz.

2025-09-19T17:39:15+00:00 ― 6 minilectura

Computación y lenguaje Avances en el modelado de lenguaje hablado

Nuevos métodos mejoran el procesamiento y la generación de habla en los modelos de lenguaje.

2025-09-19T16:02:05+00:00 ― 6 minilectura

Sonido Avances en la Tecnología de Supresión de Ruido

Nuevas técnicas mejoran la claridad del audio en entornos ruidosos.

2025-09-19T15:13:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando en la detección de palabras clave con pocos ejemplos usando datos de habla leída

Nuevos métodos mejoran la detección de palabras clave usando datos de habla leída disponibles.

2025-09-19T13:36:20+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en la tecnología de extracción de sonido

Una mirada a los métodos de extracción de sonido personalizables por región para un audio más claro.

2025-09-19T07:56:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en el seguimiento de formantes para el procesamiento del habla

Nuevos métodos de un solo paso mejoran la precisión en el seguimiento de formantes para los sonidos del habla.

2025-09-19T02:16:10+00:00 ― 5 minilectura

Procesado de Audio y Voz Nuevas Ideas en Tecnología del Lenguaje Hablado

Una mirada fresca a los avances en métodos y aplicaciones de la ciencia del lenguaje hablado.

2025-09-19T01:27:35+00:00 ― 7 minilectura

Recuperación de información Desafíos al Aprender de Videos Musicales

Este estudio examina las dificultades de usar el aprendizaje contrastivo para entender videos musicales.

2025-09-18T17:21:45+00:00 ― 6 minilectura

Computación y lenguaje Conectando el habla con modelos de lenguaje: El método BLSP

Un nuevo enfoque mejora la integración del habla con los modelos de lenguaje.

2025-09-18T15:44:35+00:00 ― 8 minilectura

Procesado de Audio y Voz Avanzando en la Predicción del Movimiento del Habla en la Disartria

Usando aprendizaje auto-supervisado para mejorar las predicciones de los movimientos del habla en la disartria.

2025-09-18T12:30:15+00:00 ― 6 minilectura

Sonido Evaluando la conexión entre la música y el baile con MDSC

Una nueva métrica para evaluar la alineación de los estilos de baile con la música.

2025-09-18T11:41:40+00:00 ― 9 minilectura

Computación y lenguaje El papel de los modelos de lenguaje preentrenados en TTS

Examinando cómo los modelos de lenguaje preentrenados mejoran la calidad del texto a voz.

2025-09-17T20:18:35+00:00 ― 7 minilectura

Procesado de Audio y Voz BWSNet: Mejorando la Evaluación de Percepción de Audio

Un nuevo modelo evalúa la percepción del audio a través de la retroalimentación humana utilizando el Escalado Mejor-Peor.

2025-09-17T13:49:55+00:00 ― 6 minilectura

Sonido Avances en técnicas de separación de fuentes musicales

Nuevos métodos mejoran la claridad de los componentes de audio en las canciones.

2025-09-17T08:09:50+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando la Separación de Audio Cinemático con BandIt

BandIt mejora la separación de fuentes de audio usando técnicas innovadoras de aprendizaje profundo.

2025-09-17T06:32:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Personalizando sistemas de reconocimiento de emociones en el habla

Personalizar la tecnología de reconocimiento de emociones mejora la precisión para hablantes diversos.

2025-09-17T04:55:30+00:00 ― 8 minilectura

Sonido Morphing de Identidad Vocal: Una Amenaza a la Seguridad

Un estudio revela amenazas graves en el reconocimiento de voz usando muestras de morfología.

2025-09-17T04:06:55+00:00 ― 6 minilectura

Sonido Batik-juega-Mozart: Un Conjunto de Datos de Piano Completo

Un conjunto de datos detallado que combina las sonatas de Mozart con interpretaciones de piano y anotaciones de expertos.

2025-09-17T03:18:20+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la estimación de tono con aprendizaje auto-supervisado

Un nuevo modelo liviano mejora la estimación de la tonalidad usando técnicas de aprendizaje auto-supervisado.

2025-09-17T00:04:00+00:00 ― 8 minilectura