Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

RSS

Procesado de Audio y Voz Presentamos el modelo SPGM para separación de voz

Un nuevo modelo mejora la eficiencia y el rendimiento en la separación de voces.

2025-09-07T10:54:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Nuevo modelo mejora la evaluación de la calidad de audio

Un nuevo enfoque evalúa la calidad del audio usando múltiples micrófonos en diferentes entornos.

2025-09-07T08:29:10+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en Técnicas de Separación de Sonido

Un nuevo método mejora la separación del sonido en diferentes frecuencias.

2025-09-07T06:03:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la comunicación de voz con cancelación de eco acústico

Explora los avances en la cancelación de eco para mejorar la calidad de las llamadas.

2025-09-07T05:14:50+00:00 ― 5 minilectura

Sonido Avances en la síntesis musical multiinstrumental

Un nuevo método mejora la generación de música al agregar contexto de interpretación.

2025-09-07T01:11:55+00:00 ― 7 minilectura

Sonido Método innovador transforma la subtitulación de audio con datos de texto

Un nuevo enfoque genera subtítulos de audio usando solo texto, mejorando la eficiencia de datos.

2025-09-07T00:23:20+00:00 ― 8 minilectura

Sonido Conectando Música: Recuperación de Audio y Partituras

Explorando los desafíos y las innovaciones para emparejar grabaciones de audio con partituras.

2025-09-06T21:57:35+00:00 ― 7 minilectura

Sonido Avanzando la búsqueda de música con aprendizaje autosupervisado

Un nuevo enfoque aprovecha el aprendizaje autosupervisado para conectar el audio y la partitura.

2025-09-06T21:09:00+00:00 ― 6 minilectura

Sonido Vinculando audio y partituras con redes recurrentes

Un nuevo método mejora la coincidencia entre audio y partituras.

2025-09-06T19:31:50+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando Conjuntos de Datos de Audio con Agrupamiento K-Means

Usando k-means para optimizar datos de audio y mejorar el entrenamiento del modelo.

2025-09-06T15:28:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz con Técnicas de Aumento de Audio

Un estudio muestra que la augmentación de audio puede mejorar el reconocimiento de voz en lenguas con pocos recursos.

2025-09-06T09:48:50+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando en el Reconocimiento Automático de Voz Multilingüe con Enmascaramiento Adaptativo

Un nuevo enfoque mejora la eficiencia en modelos de reconocimiento de voz multilingües al integrar técnicas de enmascaramiento adaptativo.

2025-09-06T09:00:15+00:00 ― 6 minilectura

Sonido Usando Audio Deepfake para Mejores Sistemas de Transcripción

Investigando audio deepfake para mejorar modelos de transcripción para idiomas menos comunes.

2025-09-06T07:23:05+00:00 ― 10 minilectura

Aprendizaje automático Mejorando el Aprendizaje con Etiquetas Débiles a Través de la Selección de Ejemplos Negativos

Nuevas estrategias mejoran el aprendizaje con etiquetas débiles al seleccionar ejemplos negativos relevantes.

2025-09-06T04:57:20+00:00 ― 7 minilectura

Sonido Nueva técnica de marca de agua para modelos de audio

Un nuevo método para marcar audio creado por modelos de difusión para proteger la propiedad.

2025-09-06T04:08:45+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz con Redes de Memoria

Nuevas técnicas mejoran los sistemas de ASR para un mejor reconocimiento de discursos largos.

2025-09-06T03:20:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en sistemas de detección de palabras clave

Nuevas técnicas buscan mejorar la precisión de los dispositivos activados por voz contra ataques.

2025-09-06T01:43:00+00:00 ― 7 minilectura

Procesado de Audio y Voz DurIAN-E: Avanzando en la tecnología de texto a voz

DurIAN-E mejora el habla sintética con una expresividad y fluidez natural mejoradas.

2025-09-06T00:54:25+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en la tecnología de reconocimiento de emociones en el habla

Descubre cómo SER mejora la interacción entre humanos y máquinas a través de la detección de emociones.

2025-09-06T00:05:50+00:00 ― 6 minilectura

Procesado de Audio y Voz Selección de Modelo Eficiente para Reconocimiento de Voz

Un método para elegir el mejor modelo de ASR basado en características de audio.

2025-09-05T23:17:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la claridad del habla con técnicas de dereverberación

Aprende cómo la dereverberación mejora el reconocimiento de voz en ambientes ruidosos.

2025-09-05T12:45:40+00:00 ― 5 minilectura

Sonido Presentamos Coco-Nut: Una Base de Datos de Voz Completa para TTS

Coco-Nut ofrece muestras de voz japonesa diversas para aplicaciones avanzadas de texto a voz.

2025-09-05T11:57:05+00:00 ― 12 minilectura

Procesado de Audio y Voz Nuevo método para estimar el volumen de una habitación usando modelos de atención

Este estudio presenta un modelo basado en atención para estimar volúmenes de habitaciones a partir de grabaciones de audio.

2025-09-05T11:08:30+00:00 ― 6 minilectura

Sonido Presentamos ASCA: Un Nuevo Enfoque para la Clasificación de Audio

El modelo ASCA mejora la precisión de clasificación de audio para conjuntos de datos pequeños.

2025-09-05T10:19:55+00:00 ― 7 minilectura

Computación y lenguaje Mi Proyecto de Tutor de Ciencias: Una Nueva Forma de Aprender

MyST busca mejorar el aprendizaje de ciencias de los niños a través de tutorías virtuales.

2025-09-05T09:31:20+00:00 ― 6 minilectura

Sonido Evaluando la localización de eventos sonoros con diferentes configuraciones de audio

Un estudio compara la precisión de localización del sonido entre formatos de audio de cuatro canales y dos canales.

2025-09-05T08:42:45+00:00 ― 7 minilectura

Sonido Avances en tecnología de transcripción de reuniones

Una mirada a M2MeT 2.0 y su impacto en la transcripción de reuniones.

2025-09-05T03:51:15+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la anonymización de voces usando códecs de audio neuronales

Un nuevo método de procesamiento de audio mejora el anonimato del hablante sin perder claridad en el discurso.

2025-09-05T01:25:30+00:00 ― 7 minilectura

Sonido Transformando los movimientos de la lengua en sonidos del habla

Este estudio convierte datos de MRI de la lengua en audio de voz real.

2025-09-04T22:11:10+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances y desafíos en los modelos de reconocimiento de voz

Este estudio analiza cómo la compresión de modelos afecta el reconocimiento de voz en entornos ruidosos.

2025-09-04T19:45:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la Detección de Eventos Sonoros con OAL

Explora cómo el Aprendizaje Activo en Línea mejora la eficiencia del reconocimiento de sonido.

2025-09-04T18:56:50+00:00 ― 7 minilectura

Sonido Avances en modelos de reconocimiento de audio y voz

Un nuevo modelo mejora la comprensión del habla y los sonidos al mismo tiempo.

2025-09-04T18:08:15+00:00 ― 6 minilectura

Aprendizaje automático Clasificación Automática en Entrevistas Motivacionales

Un sistema que clasifica el lenguaje del cliente en sesiones de terapia usando varios métodos de comunicación.

2025-09-04T16:31:05+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en la detección de la disartria usando aprendizaje automático

Nueva tecnología mejora la detección de la disartria y la clasificación de su gravedad.

2025-09-04T11:39:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la detección de patologías vocales

Nuevos métodos mejoran la detección temprana de problemas de voz usando características de la fuente glótica.

2025-09-04T10:02:25+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando el reconocimiento de voz para acentos diversos

Mejorando los modelos de voz para reconocer y adaptarse mejor a diferentes acentos.

2025-09-04T08:25:15+00:00 ― 5 minilectura

Sonido Avances en la Clasificación de Audio Usando DCLS

DCLS mejora el rendimiento de clasificación de audio al aprender las posiciones del núcleo durante el entrenamiento.

2025-09-04T07:36:40+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando el aprendizaje audiovisual con co-augmentación de velocidad

Un nuevo método mejora el aprendizaje automático de datos audio-visuales.

2025-09-04T05:59:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la tecnología de extracción de voz

Presentando nuevos modelos para mejorar la extracción de voz en entornos ruidosos.

2025-09-04T02:45:10+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Adaptación de Bajo Rango

Un nuevo método mejora la eficiencia del reconocimiento de voz utilizando adaptación de bajo rango.

2025-09-04T00:19:25+00:00 ― 6 minilectura