Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

RSS

Procesado de Audio y Voz Sesgo en el Aprendizaje por Transferencia para el Reconocimiento de Música

Este estudio explora el sesgo en modelos de audio utilizados para el reconocimiento de instrumentos.

2025-10-06T09:39:25+00:00 ― 7 minilectura

Sonido Avances en la clasificación de géneros musicales usando aprendizaje profundo

Este estudio explora un enfoque de aprendizaje profundo para clasificar con precisión los géneros musicales.

2025-10-06T08:50:50+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en la Identificación de Temas a partir de Datos de Audio

La investigación explora métodos para identificar temas directamente de grabaciones de audio.

2025-10-05T23:56:25+00:00 ― 6 minilectura

Sonido Localización automática de fuentes sonoras en aguas poco profundas

Nuevo método mejora el seguimiento de la ubicación de fuentes sonoras en ambientes acuáticos poco profundos.

2025-10-05T13:27:48+00:00 ― 8 minilectura

Sonido Avanzando en la Tecnología del Habla con SCRAPS

Un nuevo modelo conecta la fonética y la acústica para mejorar la tecnología del habla.

2025-10-05T13:24:50+00:00 ― 8 minilectura

Sonido Avances en el Reconocimiento de Emociones con Aprendizaje Auto-Supervisado

Este estudio destaca el papel del aprendizaje auto-supervisado en la detección de emociones a partir de datos de audio.

2025-10-05T08:33:20+00:00 ― 7 minilectura

Procesado de Audio y Voz Haciendo la música fácil para todos

Una nueva interfaz simplifica la creación de música para principiantes usando tecnología de texto a audio.

2025-10-04T18:47:25+00:00 ― 6 minilectura

Sonido Evaluando audífonos y mejora de voz con IA

La investigación resalta las mejoras que la IA puede aportar a los audífonos en entornos ruidosos.

2025-10-04T17:58:50+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la separación de fuentes de música con datos ruidosos

Nuevo método mejora datos mal etiquetados, mejorando la separación de fuentes de música.

2025-10-04T10:41:35+00:00 ― 7 minilectura

Sonido Nuevos Métodos en la Decodificación de la Atención Auditiva

Avances en descifrar cómo la gente se concentra en los sonidos usando la actividad cerebral.

2025-10-04T07:43:21+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en técnicas de síntesis de campo sonoro

Un nuevo método mejora la claridad del sonido y la localización usando un enfoque híbrido.

2025-10-04T07:27:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la Cancelación de Eco Acústico con CMNet

CMNet mejora la claridad de la voz al reducir el eco en los dispositivos de comunicación.

2025-10-04T06:38:40+00:00 ― 6 minilectura

Sonido Mejorando el Reconocimiento de Objetivos Submarinos con Redes Neuronales

Un nuevo método mejora la clasificación de sonidos submarinos de barcos usando redes neuronales.

2025-10-04T05:01:30+00:00 ― 6 minilectura

Sonido Avances en la tecnología de audífonos

La investigación busca mejorar la claridad en los audífonos para una mejor comunicación.

2025-10-04T02:35:45+00:00 ― 7 minilectura

Sonido Avances en el Mejora del Habla Usando Redes Neuronales de Picos

Un nuevo método para mejorar la calidad del habla usando redes eficientes en energía.

2025-10-03T21:44:15+00:00 ― 6 minilectura

Sonido Entendiendo las vocalizaciones de las vacas durante el estrés

La investigación destaca la comunicación de las vacas para mejorar las prácticas de la ganadería lechera.

2025-10-03T15:15:35+00:00 ― 6 minilectura

Sonido Presentamos MuReNN: Un Nuevo Modelo para el Procesamiento de Audio

MuReNN combina modelos paramétricos y no paramétricos para mejorar el análisis de audio.

2025-10-03T14:14:43+00:00 ― 5 minilectura

Aprendizaje automático BioLingual: Una Nueva Era en Bioacústica

Revolucionando la investigación sobre la comunicación animal con integración innovadora de audio y lenguaje.

2025-10-03T11:32:00+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en la Detección de Altavoces Activos Usando Audio

Las investigaciones muestran que tener varios micrófonos ayuda a detectar y localizar a los hablantes.

2025-10-03T11:12:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en Mejora de Voz con PCNN

Presentamos un nuevo modelo para hablar más claro en ambientes ruidosos.

2025-10-03T07:58:20+00:00 ― 6 minilectura

Multimedia Avances en la coincidencia acústica visual

Un nuevo método mejora la coincidencia de audio usando imágenes, aumentando el realismo en los entornos de audio.

2025-10-03T03:55:25+00:00 ― 8 minilectura

Procesado de Audio y Voz Nuevo conjunto de datos vincula emociones con música MIDI

Un conjunto de datos conecta emociones con canciones MIDI usando el análisis de letras.

2025-10-03T02:18:15+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en Técnicas de Mejora del Sonido

Mejorando la calidad del habla a través de métodos innovadores y conjuntos de datos multilingües.

2025-10-02T23:52:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Abordando la Pérdida de Calidad de Audio Durante la Transmisión

Nuevas técnicas buscan mejorar la calidad de audio al abordar la pérdida de paquetes.

2025-10-02T22:15:20+00:00 ― 6 minilectura

Sonido Detección Efectiva de Audio Deepfake

Nuevos sistemas están diseñados para detectar grabaciones de audio falsas con mejor precisión.

2025-10-02T18:12:25+00:00 ― 7 minilectura

Sonido Avances en Diarización de Hablar a Través de la Integración Audio-Visual

Nuevos sistemas mejoran la identificación de hablantes usando datos de audio y visuales.

2025-10-02T15:46:40+00:00 ― 5 minilectura

Sonido MoisesDB: Un gran avance en la separación de fuentes musicales

MoisesDB ofrece un conjunto de datos detallado para la separación avanzada de sonidos en la música.

2025-10-02T09:18:00+00:00 ― 7 minilectura

Sonido Avanzando la subtitulación musical con modelos de lenguaje grandes

Usando LLMs para crear un montón de datos para la subtitulación de música.

2025-10-02T08:29:25+00:00 ― 8 minilectura

Computación y lenguaje Avances en la tecnología de entrenamiento de pronunciación

Los investigadores están mejorando el entrenamiento de pronunciación con nuevas tecnologías para los que aprenden idiomas.

2025-10-02T07:40:50+00:00 ― 6 minilectura

Sonido Avances en la tecnología de transferencia de estilo de voz

HierVST transforma voces sin problemas, mejorando la calidad de audio sin necesidad de muchos datos.

2025-10-02T05:15:05+00:00 ― 6 minilectura

Procesado de Audio y Voz Nuevo modelo revoluciona el análisis de la estructura musical

Un enfoque unificado mejora el análisis musical al integrar múltiples elementos estructurales.

2025-10-01T23:35:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la Clasificación del Habla para Niños con Autismo

La investigación se centra en clasificar el habla de niños y adultos usando datos no etiquetados.

2025-10-01T22:46:25+00:00 ― 7 minilectura

Multimedia Avances en la estimación de compromiso para conversaciones

La investigación desarrolla un modelo para medir con precisión la participación en conversaciones.

2025-10-01T21:57:50+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones DAVIS: Un Nuevo Enfoque para la Separación de Sonido

DAVIS ofrece una forma nueva de enfrentar la separación de sonido audio y visual.

2025-10-01T19:32:05+00:00 ― 6 minilectura

Sonido Mejorando las Técnicas de Segmentación Audiovisual

Un nuevo método mejora la identificación precisa de objetos que producen sonido en videos.

2025-10-01T13:52:00+00:00 ― 8 minilectura

Sonido Avances en Texto a Voz con DiffProsody

DiffProsody mejora la velocidad y calidad de la síntesis de voz a través de una generación de prosodia innovadora.

2025-10-01T13:03:25+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en la Reconstrucción de Campos Sonoros con GANs

Los modelos de aprendizaje profundo mejoran la reconstrucción del campo sonoro en entornos complejos.

2025-10-01T04:57:35+00:00 ― 8 minilectura

Sonido Abordando la Guerra de la Sonoridad con Redes De-limitadoras

Nueva tecnología busca restaurar la calidad de la música que se perdió por la compresión de volumen.

2025-10-01T02:31:50+00:00 ― 6 minilectura

Sonido Sistema Automatizado para Identificar la Afasia

Nuevo método promete identificar más rápido trastornos del habla como la afasia.

2025-09-30T21:40:20+00:00 ― 6 minilectura

Criptografía y seguridad Técnicas de sonido inaudible para manipulación del habla

Nuevo método usa sonidos ultrasónicos para confundir sistemas de reconocimiento de voz sin ser detectado.

2025-09-30T19:14:35+00:00 ― 7 minilectura