Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

Sonido Detectando Llamadas de Audio Deepfake: Un Nuevo Enfoque

Aprende a identificar llamadas de audio falsas con técnicas innovadoras de desafío-respuesta.

2025-08-21T07:34:35+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones CustomListener: Una Nueva Era en Interacciones Virtuales

CustomListener crea avatares realistas que responden a las conversaciones de manera dinámica.

2025-08-21T05:08:50+00:00 ― 7 minilectura

Sonido Avances en técnicas de diarización automática de hablantes

La investigación destaca la importancia del tiempo sobre las características específicas del hablante en los modelos de diarización.

2025-08-21T00:17:20+00:00 ― 7 minilectura

Multimedia Avances en la tecnología de labios a habla

Nuevo método mejora la síntesis de voz para personas que no pueden hablar.

2025-08-20T20:14:25+00:00 ― 8 minilectura

Interacción Persona-Ordenador Avances en Interfaces de Habla Silenciosa

Una mirada a MONA, un sistema que mejora la comunicación en silencio.

2025-08-20T16:11:30+00:00 ― 5 minilectura

Sonido Entendiendo la tecnología de reconocimiento automático de voz

Una visión general de ASR y sus avances en aplicaciones modernas.

2025-08-20T15:22:55+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en el Reconocimiento de Emociones en el Habla con la Base de Datos EMOVOME

Explorando nuevos métodos para mejorar el reconocimiento de emociones en el habla usando datos naturales.

2025-08-20T01:37:00+00:00 ― 6 minilectura

Robótica Mejorando el reconocimiento de voz de los robots en entornos ruidosos

La investigación se centra en ayudar a los robots a entender mejor el habla en medio del ruido de fondo.

2025-08-19T22:22:40+00:00 ― 6 minilectura

Sonido Automatizando la Evaluación de Dificultad Musical Usando Análisis de Audio

Este estudio avanza la educación musical al automatizar la evaluación de la dificultad de las piezas de piano.

2025-08-19T21:34:05+00:00 ― 7 minilectura

Procesado de Audio y Voz Evaluando el Reconocimiento de Voz en Entornos Ruidosos

Un nuevo estándar evalúa el rendimiento de los sistemas de reconocimiento de voz en medio de diversas interferencias.

2025-08-19T14:16:50+00:00 ― 6 minilectura

Sonido El futuro de la IA en la creación de música

Explorando el papel de la IA en la creación de música a través de técnicas y estructuras avanzadas.

2025-08-18T14:47:55+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando modelos de voz con RobustDistiller

Un nuevo método mejora el rendimiento y la eficiencia del modelo de voz en entornos ruidosos.

2025-08-18T05:53:30+00:00 ― 6 minilectura

Procesado de Audio y Voz La importancia de la reconstrucción del campo sonoro

Explorando cómo la reconstrucción de campos de sonido impacta las experiencias de audio en diferentes aplicaciones.

2025-08-18T02:39:10+00:00 ― 8 minilectura

Sonido Neural-SRP: Avanzando en la Localización de Fuentes de Sonido

Un nuevo método combina técnicas tradicionales con redes neuronales para mejorar la localización del sonido.

2025-08-17T23:24:50+00:00 ― 6 minilectura

Sonido Avanzando en la detección acústica con aprendizaje profundo

Un nuevo enfoque para mejorar la detección acústica sin comprometer la calidad del audio.

2025-08-17T20:59:05+00:00 ― 8 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz para Idiomas de Bajos Recursos

Un método para mejorar la precisión del reconocimiento de voz en los idiomas kannada y telugu.

2025-08-17T15:19:00+00:00 ― 9 minilectura

Sonido Avances en la generación de gestos a partir del habla

Un nuevo sistema mejora la creación de gestos realistas usando solo audio de voz.

2025-08-17T14:30:25+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en implantes cocleares con tecnologías de IA

La IA está mejorando los implantes cocleares para tener mejor audición y comunicación en entornos difíciles.

2025-08-17T13:41:50+00:00 ― 8 minilectura

Sonido Notochord: Una nueva herramienta MIDI para músicos

Notochord mejora la creación de música MIDI en tiempo real usando IA para actuaciones más ricas.

2025-08-17T06:24:35+00:00 ― 7 minilectura

Sonido Prompt-Cantante: Un Nuevo Enfoque para el Control de la Voz Cantante

Un método para tener un control más intuitivo sobre las voces cantando usando comandos en lenguaje natural.

2025-08-17T01:33:05+00:00 ― 8 minilectura

Computación y lenguaje Usando Estructuras Gramaticales para Identificar Autores

Este artículo habla sobre nuevos métodos para clasificar la autoría a través del análisis gramatical.

2025-08-16T19:53:00+00:00 ― 8 minilectura

Sonido Avances en el Reconocimiento de Emociones en el Habla con emoDARTS

El nuevo modelo emoDARTS mejora la precisión en el reconocimiento de emociones en el habla usando aprendizaje profundo.

2025-08-16T17:27:15+00:00 ― 8 minilectura

Computación y lenguaje El modelo imita el aprendizaje de palabras en los niños

Un modelo muestra sesgo de exclusividad mutua en pruebas de asociación de palabras.

2025-08-16T15:50:05+00:00 ― 8 minilectura

Sonido Avances en las características de voz de texto a habla

Un estudio sobre cómo mejorar los sistemas de TTS con muestras de voz diversas.

2025-08-16T12:35:45+00:00 ― 5 minilectura

Procesado de Audio y Voz La tendencia en aumento de los subtítulos en streaming

Los subtítulos se están volviendo esenciales para mejorar la experiencia del espectador en los servicios de streaming.

2025-08-16T05:18:30+00:00 ― 9 minilectura

Procesado de Audio y Voz Avances en la tecnología de edición de audio

Nuevas herramientas mejoran la edición de grabaciones de voz y la calidad de producción.

2025-08-15T09:03:55+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la tecnología de acompañamiento para danza

Nuevos modelos mejoran las interacciones en dúo en las presentaciones de baile virtuales.

2025-08-14T21:43:45+00:00 ― 8 minilectura

Procesado de Audio y Voz Reviviendo la Historia: El Arte de la Restauración de Audio

Descubre cómo la ecualización generativa da nueva vida a viejas grabaciones de música.

2025-08-14T20:06:35+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en técnicas de reverberación artificial

Nuevos métodos mejoran la simulación de sonido en diferentes entornos.

2025-08-14T09:35:00+00:00 ― 7 minilectura

Computación y lenguaje Clasificando subdialectos del kurdo sorani a través de datos de audio

La investigación identifica y clasifica los dialectos kurdos sorani usando grabaciones de audio extensas.

2025-08-14T07:57:50+00:00 ― 7 minilectura

Procesado de Audio y Voz Automatizando la afinación del sonido para acústicas realistas

Un nuevo método mejora el procesamiento de sonido mediante la sintonización automática de Redes de Retardo de Retroalimentación.

2025-08-14T07:09:15+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en la Evaluación Automática de la Calidad del Habla

Un nuevo método mejora la evaluación del habla usando grabaciones completas.

2025-08-14T06:20:40+00:00 ― 9 minilectura

Procesado de Audio y Voz Avanzando la tecnología de detección de hablantes activos

Nuevos métodos mejoran la detección de altavoces audio-visuales en entornos complicados.

2025-08-14T01:29:10+00:00 ― 8 minilectura

Procesado de Audio y Voz Abordando el desafío de los deepfakes de audio

Este estudio investiga la efectividad de los modelos multilingües en la detección de deepfakes de audio.

2025-08-14T00:40:35+00:00 ― 7 minilectura

Sonido Midiendo la Adherencia en Modelos de Música Generativa

Un nuevo enfoque para evaluar qué tan bien la música sigue las indicaciones de audio.

2025-08-13T23:03:25+00:00 ― 10 minilectura

Visión por Computador y Reconocimiento de Patrones Presentamos el conjunto de datos 360+x para mejorar la comprensión de escenas

Un nuevo conjunto de datos mejora la forma en que los robots interpretan entornos del mundo real.

2025-08-13T18:11:55+00:00 ― 8 minilectura

Sonido Nuevo enfoque para la separación de audio usando lenguaje

Este método mejora la separación de audio al combinar descripciones de lenguaje con análisis de sonido.

2025-08-13T14:57:35+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Presentamos UniAV: Un Enfoque Unificado para la Localización de Videos

UniAV combina la localización de acción, la detección de sonido y la localización de eventos audio-visuales para una mejor comprensión del video.

2025-08-13T10:06:05+00:00 ― 9 minilectura

Procesado de Audio y Voz CLaM-TTS: Avanzando la Tecnología de Texto a Voz

CLaM-TTS mejora la síntesis de voz usando técnicas avanzadas para tener mejor eficiencia y calidad.

2025-08-13T08:28:55+00:00 ― 7 minilectura

Redes sociales y de información Analizando música a través de gráficos

Los gráficos permiten obtener nuevas ideas sobre la estructura de la música y sus relaciones.

2025-08-13T03:09:57+00:00 ― 6 minilectura