Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

RSS

Procesado de Audio y Voz Vibravox: Avanzando en la Tecnología de Reconocimiento de Voz

Un nuevo conjunto de datos busca mejorar la captura de voz usando sensores de conducción por el cuerpo.

2025-07-15T14:35:55+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo método para detectar deepfakes

Un nuevo enfoque mejora la detección de deepfakes usando análisis audiovisual.

2025-07-15T12:10:10+00:00 ― 7 minilectura

Sonido La evolución de los sistemas de reconocimiento automático de voz

Una mirada al progreso en las tecnologías y métodos de reconocimiento de voz.

2025-07-15T11:21:35+00:00 ― 6 minilectura

Sonido Mejorando la detección de tartamudez con MMSD-Net

Un nuevo método mejora la detección de tartamudeo combinando datos de audio, video y texto.

2025-07-15T07:18:40+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en sistemas de diarización de hablantes y lenguajes

Un equipo mejora el procesamiento de audio para identificar hablantes y lenguajes.

2025-07-15T03:15:45+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en el Reconocimiento de Emociones a través del Habla

La investigación sobre la detección de emociones humanas a través del habla muestra potencial para varias aplicaciones.

2025-07-15T00:50:00+00:00 ― 6 minilectura

Sonido Generación de sonido innovadora para modelos humanos en 3D

Un nuevo método mejora la creación de sonido para modelos humanos 3D realistas.

2025-07-15T00:01:25+00:00 ― 8 minilectura

Sonido Estimando tasas de respiración a través del análisis del habla

Este estudio revela cómo el habla puede estimar las tasas de respiración usando modelos avanzados.

2025-07-14T23:12:50+00:00 ― 7 minilectura

Sonido GraphMuse: Una Nueva Herramienta para el Análisis Musical

GraphMuse simplifica el análisis de datos de música simbólica con técnicas avanzadas de aprendizaje automático.

2025-07-14T19:58:30+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el reconocimiento de voz para el idioma polaco

La investigación presenta nuevos métodos para evaluar sistemas de reconocimiento de voz en polaco.

2025-07-14T16:44:10+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando el Formato de Números en Transcripciones de ASR

Este artículo habla sobre cómo mejorar el formato de expresión numérica en transcripciones automáticas.

2025-07-14T15:55:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en técnicas de clasificación musical

El aprendizaje auto-supervisado transforma el reconocimiento musical a través de métodos innovadores.

2025-07-14T12:41:15+00:00 ― 7 minilectura

Procesado de Audio y Voz MSceneSpeech: Avanzando la Síntesis de Voz en Mandarín

Un nuevo conjunto de datos mejora el habla de máquina para el mandarín, buscando una expresión más natural.

2025-07-14T09:26:55+00:00 ― 7 minilectura

Multimedia Avanzando en la localización de fuentes de sonido mediante la integración audio-visual

Un estudio sobre cómo mejorar la localización de fuentes de sonido aprovechando mejor la información auditiva y visual.

2025-07-14T06:12:35+00:00 ― 9 minilectura

Aprendizaje automático Evaluando la salud cognitiva a través del análisis del habla

Un nuevo marco analiza el habla para identificar el deterioro cognitivo leve en diferentes idiomas.

2025-07-14T05:24:00+00:00 ― 6 minilectura

Sonido IA y el desafío de los géneros musicales diversos

Explorando el impacto de la IA en estilos musicales subrepresentados.

2025-07-14T02:58:15+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el texto a voz para idiomas indios

Un método para mejorar los sistemas de TTS y que pronuncien mejor las palabras OOV en India.

2025-07-14T02:09:40+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el Aprendizaje Auto-Supervisado para el Procesamiento de Voz

Un nuevo modelo mejora la eficiencia en el procesamiento del habla con menos consumo de energía.

2025-07-14T00:32:30+00:00 ― 5 minilectura

Sonido Avances en la tecnología de audífonos usando aprendizaje automático

Nuevos modelos de aprendizaje automático mejoran la claridad del habla para usuarios de audífonos.

2025-07-13T23:43:55+00:00 ― 7 minilectura

Sonido Estudiando interacciones sociales con audio de baja frecuencia

La investigación explora audio de baja frecuencia para proteger la privacidad en estudios de comportamiento social.

2025-07-13T21:18:10+00:00 ― 7 minilectura

Procesado de Audio y Voz Entendiendo la Propagación del Sonido en Espacios Conectados

Explorando cómo se comporta el sonido en entornos de varias habitaciones y sus implicaciones en la tecnología.

2025-07-13T20:29:35+00:00 ― 7 minilectura

Procesado de Audio y Voz Las herramientas de IA transforman el proceso de edición musical

Nuevas herramientas de IA están simplificando la edición musical con técnicas innovadoras y mejor precisión.

2025-07-13T18:52:25+00:00 ― 6 minilectura

Computación y lenguaje Un nuevo enfoque para la traducción de voz: coincidencia de voces preestablecidas

El emparejamiento de voz preestablecido mejora la traducción de voz mientras asegura la privacidad y reduce riesgos.

2025-07-13T18:03:50+00:00 ― 7 minilectura

Sonido Asistente de Compositor 2: Una Nueva Herramienta para Músicos

Un nuevo sistema ayuda a los músicos a crear música con más control y precisión.

2025-07-13T14:00:55+00:00 ― 9 minilectura

Sonido Evaluando el impacto de la IA en la originalidad de la música

Una nueva herramienta para evaluar la replicación en la música hecha por IA.

2025-07-13T12:23:45+00:00 ― 9 minilectura

Sonido Generación de Audio Abierto: Un Nuevo Modelo

Un nuevo modelo de texto a audio usando solo datos públicos.

2025-07-13T11:35:10+00:00 ― 6 minilectura

Computación y lenguaje Desafíos e Innovaciones en la Investigación del Code-Switching

Un nuevo conjunto de datos busca mejorar la comprensión del cambio de código entre varios idiomas.

2025-07-13T09:58:00+00:00 ― 6 minilectura

Computación y lenguaje Representación de género en las noticias de televisión francesas

Este artículo examina el equilibrio de género en los noticieros franceses en diferentes temas.

2025-07-13T08:20:50+00:00 ― 6 minilectura

Computación y lenguaje Rasa: Un Gran Avance en la Síntesis de Voz en Idiomas Indios

El conjunto de datos Rasa mejora la conversión de texto a voz para idiomas indios con una voz neutra y expresiva.

2025-07-13T05:55:05+00:00 ― 7 minilectura

Sonido Avances en la tecnología de reconocimiento de emociones en el habla

Nuevos métodos mejoran la comprensión de las emociones humanas en el habla por parte de las máquinas.

2025-07-12T18:34:55+00:00 ― 5 minilectura

Sonido Haciendo que las herramientas de IA sean accesibles para los artistas

Simplificar las herramientas de IA puede ayudar a los artistas a mejorar su expresión creativa.

2025-07-12T17:46:20+00:00 ― 6 minilectura

Sonido MusiConGen: Avanzando la tecnología de texto a música

MusiConGen mejora el control del usuario en la generación de texto a música.

2025-07-12T16:57:45+00:00 ― 7 minilectura

Neuronas y cognición Avances en la tecnología de EEG para la recuperación del habla

Investigadores mejoran la decodificación del habla usando EEG para ayudar a quienes tienen dificultades para hablar.

2025-07-12T16:20:33+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en Técnicas de Mejora del Habla

Un nuevo modelo mejora la claridad del habla al atacar el ruido y los ecos.

2025-07-12T15:20:35+00:00 ― 7 minilectura

Computación y lenguaje Presentamos J-CHAT: Un Nuevo Conjunto de Datos para la Investigación en Diálogo Hablado

J-CHAT ofrece un gran conjunto de datos de código abierto para mejorar los sistemas de diálogo hablado.

2025-07-12T12:06:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la Creación de Instrumentos Musicales Basados en Muestras

Nuevos métodos permiten a los músicos crear instrumentos a partir de sonidos.

2025-07-12T08:51:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Codecs de voz y preservación emocional

Examinando cómo los códecs mantienen los tonos emocionales en los datos de voz.

2025-07-12T06:26:10+00:00 ― 7 minilectura

Procesado de Audio y Voz Transformando la transmisión con tecnología IP y etiquetado de audio

Descubre cómo la transmisión IP y el etiquetado de audio están transformando la entrega de contenido.

2025-07-12T05:37:35+00:00 ― 7 minilectura

Interacción Persona-Ordenador Humanos y robots crean música juntos

Una mirada a cómo la tecnología y los músicos colaboran en una actuación única.

2025-07-12T03:11:50+00:00 ― 9 minilectura

Robótica Músico robótico mejora la experiencia de compra

Un robot pone música en una tienda para que los clientes se diviertan más.

2025-07-12T02:23:15+00:00 ― 8 minilectura