Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

RSS

Procesado de Audio y Voz Mejorando la Clasificación del Habla para Niños con Autismo

La investigación se centra en clasificar el habla de niños y adultos usando datos no etiquetados.

2025-10-01T22:46:25+00:00 ― 7 minilectura

Multimedia Avances en la estimación de compromiso para conversaciones

La investigación desarrolla un modelo para medir con precisión la participación en conversaciones.

2025-10-01T21:57:50+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones DAVIS: Un Nuevo Enfoque para la Separación de Sonido

DAVIS ofrece una forma nueva de enfrentar la separación de sonido audio y visual.

2025-10-01T19:32:05+00:00 ― 6 minilectura

Sonido Mejorando las Técnicas de Segmentación Audiovisual

Un nuevo método mejora la identificación precisa de objetos que producen sonido en videos.

2025-10-01T13:52:00+00:00 ― 8 minilectura

Sonido Avances en Texto a Voz con DiffProsody

DiffProsody mejora la velocidad y calidad de la síntesis de voz a través de una generación de prosodia innovadora.

2025-10-01T13:03:25+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en la Reconstrucción de Campos Sonoros con GANs

Los modelos de aprendizaje profundo mejoran la reconstrucción del campo sonoro en entornos complejos.

2025-10-01T04:57:35+00:00 ― 8 minilectura

Sonido Abordando la Guerra de la Sonoridad con Redes De-limitadoras

Nueva tecnología busca restaurar la calidad de la música que se perdió por la compresión de volumen.

2025-10-01T02:31:50+00:00 ― 6 minilectura

Sonido Sistema Automatizado para Identificar la Afasia

Nuevo método promete identificar más rápido trastornos del habla como la afasia.

2025-09-30T21:40:20+00:00 ― 6 minilectura

Criptografía y seguridad Técnicas de sonido inaudible para manipulación del habla

Nuevo método usa sonidos ultrasónicos para confundir sistemas de reconocimiento de voz sin ser detectado.

2025-09-30T19:14:35+00:00 ― 7 minilectura

Computación y lenguaje Avances en tecnología de texto a voz

Nuevos métodos mejoran la calidad del habla sintética usando aprendizaje auto-supervisado.

2025-09-30T17:37:25+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Refuerzo de Palabras Clave

Un nuevo método mejora la transcripción de palabras clave raras en conversaciones de negocios.

2025-09-30T10:20:10+00:00 ― 7 minilectura

Sonido Avanzando el Reconocimiento de Voz con Aprendizaje Federado

El Aprendizaje Federado mejora el reconocimiento de voz mientras mantiene los datos del usuario privados.

2025-09-30T08:43:00+00:00 ― 6 minilectura

Sonido MusicLDM: Un Nuevo Enfoque para la Generación de Música a Partir de Texto

MusicLDM transforma texto en música original, ofreciendo nuevas formas de creatividad.

2025-09-30T05:28:40+00:00 ― 9 minilectura

Sonido Mejorando las técnicas de extracción de melodía vocal con aprendizaje profundo

Nuevos métodos mejoran la precisión para extraer melodías cantadas de audio mezclado.

2025-09-30T01:25:45+00:00 ― 9 minilectura

Sonido Avances en técnicas de mejora de audio

Nuevo modelo mejora la claridad del habla en entornos ruidosos usando métodos innovadores.

2025-09-29T22:11:25+00:00 ― 6 minilectura

Sonido Analizando canciones populares coreanas a través de la tecnología

Un estudio sobre las canciones folclóricas coreanas utilizando métodos analíticos modernos.

2025-09-29T21:22:50+00:00 ― 10 minilectura

Gráficos DiffDance: Una Nueva Era en la Generación de Baile

DiffDance crea secuencias de baile detalladas que se ajustan bien a la música.

2025-09-29T16:31:20+00:00 ― 7 minilectura

Sonido Abordando el sesgo de género en la transcripción de voces cantadas

Examinando la equidad en la tecnología de transcripción de voces cantantes entre géneros.

2025-09-29T15:42:45+00:00 ― 9 minilectura

Sonido Avances en la personalización de palabras clave para sistemas de reconocimiento de voz

SeACo-Paraformer trae flexibilidad y precisión a la tecnología de reconocimiento de voz.

2025-09-29T14:05:35+00:00 ― 7 minilectura

Procesado de Audio y Voz Examinando la calidad de la voz y su impacto

Este estudio explora métodos de clasificación de calidad de voz y su importancia en la comunicación.

2025-09-29T12:28:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la tecnología de control activo de ruido

Aprende cómo los nuevos algoritmos mejoran las técnicas de cancelación de ruido para diferentes aplicaciones.

2025-09-29T05:59:45+00:00 ― 5 minilectura

Procesado de Audio y Voz Nueva herramienta mide la calidad del audio con análisis de video

AudioVMAF combina métricas de video para mejorar la evaluación de la calidad del audio.

2025-09-29T01:56:50+00:00 ― 7 minilectura

Sonido Avances en la detección de audio falso con RAWM

Un nuevo método mejora la detección de audio falso usando modificación adaptativa de pesos.

2025-09-29T01:08:15+00:00 ― 7 minilectura

Criptografía y seguridad La creciente necesidad de esteganálisis en la seguridad de la información

La esteganálisis ayuda a detectar mensajes ocultos en multimedia, asegurando una comunicación segura.

2025-09-28T23:31:05+00:00 ― 5 minilectura

Procesado de Audio y Voz Separando la identidad del hablante de los datos de voz

Un estudio sobre cómo separar la identidad del hablante de las señales de voz para mejorar el procesamiento.

2025-09-28T19:28:10+00:00 ― 6 minilectura

Multimedia TranSTYLer: Un Salto en la Comunicación Virtual

Transformando gestos para agentes virtuales con significado preservado.

2025-09-28T18:39:35+00:00 ― 7 minilectura

Sonido Avances en la Localización de Fuentes de Sonido Usando Redes Neuronales

Explorando cómo las redes neuronales mejoran la precisión en la localización de fuentes de sonido.

2025-09-28T12:10:55+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz en punjabi con métodos de autoentrenamiento

Los investigadores mejoran el reconocimiento automático del habla para Punjabi usando técnicas innovadoras de autoentrenamiento.

2025-09-28T08:56:35+00:00 ― 7 minilectura

Sonido Avances en el reconocimiento de voz del hablante objetivo

Nuevo modelo mejora el reconocimiento de voz en entornos ruidosos al centrarse en un solo hablante.

2025-09-28T08:08:00+00:00 ― 5 minilectura

Sonido Equilibrando la privacidad y la monitorización de audio inteligente

Nuevos métodos buscan proteger la privacidad del habla en sistemas de monitoreo de audio.

2025-09-28T06:30:50+00:00 ― 6 minilectura

Computación y lenguaje Avanzando en la síntesis de habla expresiva con un nuevo conjunto de datos

Un nuevo conjunto de datos mejora la síntesis de voz al captar la expresión emocional sin depender del texto.

2025-09-27T18:22:05+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la Clasificación de Tonos Musicales con SDTW

Nuevas estrategias para mejorar la estabilidad del entrenamiento en la clasificación de tonos musicales.

2025-09-27T13:30:35+00:00 ― 7 minilectura

Sonido Avances en la Tecnología de Conversión de Voz

Phoneme Hallucinator transforma la conversión de voz con datos limitados para obtener salidas más claras.

2025-09-27T10:16:15+00:00 ― 5 minilectura

Sonido Avanzando en la Generación de Gestos para Humanos Digitales

Un nuevo método crea gestos realistas a partir de audio de voz cruda.

2025-09-27T08:39:05+00:00 ― 6 minilectura

Aprendizaje automático Nuevo método para analizar la actividad cerebral durante el habla

Los investigadores desarrollan un Alineador Neuronal Latente para interpretar mejor las señales del cerebro durante las tareas de hablar.

2025-09-27T05:24:45+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando en el Reconocimiento de Voz Bilingüe con Unidades de Grafemas

Mejorando sistemas ASR híbridos para habla bilingüe usando unidades de grafemas.

2025-09-27T03:47:35+00:00 ― 7 minilectura

Computación y lenguaje Avances en el Aprendizaje Conjunto de Habla y Texto

Un nuevo modelo mejora la alineación de voz y texto para un mejor reconocimiento automático.

2025-09-27T02:10:25+00:00 ― 7 minilectura

Sonido Avances en el reconocimiento visual del habla con Lip2Vec

Lip2Vec mejora el reconocimiento visual del habla usando menos datos etiquetados.

2025-09-27T01:21:50+00:00 ― 8 minilectura

Computación y lenguaje Avances en la tecnología de reconocimiento de voz

Nuevos métodos mejoran la precisión y la velocidad en los sistemas de reconocimiento de voz.

2025-09-26T11:35:55+00:00 ― 6 minilectura

Aprendizaje automático O-1: Una Nueva Frontera en el Entrenamiento de Reconocimiento de Voz

O-1 mejora el reconocimiento de voz al optimizar métodos de autoentrenamiento.

2025-09-26T09:10:10+00:00 ― 6 minilectura