Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

RSS

Computación y lenguaje Las Nuances del Sarcasmo en la Comunicación

Explorando cómo el tono y las palabras moldean nuestra comprensión del sarcasmo.

2025-06-23T15:28:10+00:00 ― 7 minilectura

Procesado de Audio y Voz Simplificando la creación de conjuntos de datos musicales para AMT

Un nuevo método agiliza la creación de conjuntos de datos musicales para la transcripción automática.

2025-06-23T14:39:35+00:00 ― 8 minilectura

Procesado de Audio y Voz Preservando los dialectos tamil a través de la tecnología

Un sistema para clasificar los dialectos literarios y coloquiales del tamil usando características de sonido.

2025-06-23T13:51:00+00:00 ― 6 minilectura

Sonido Progreso en el Reconocimiento de Voces: Resumen del Reto VoxCeleb

Una visión general de los avances en el reconocimiento de voz a través del VoxCeleb Challenge.

2025-06-23T13:02:25+00:00 ― 5 minilectura

Procesado de Audio y Voz Avanzando la Conversión de Habla Susurrada con MaskCycleGAN

Un nuevo método mejora la conversión de susurros a habla normal usando técnicas avanzadas.

2025-06-23T09:48:05+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz: Susurrado vs. Normal

Nuevos métodos mejoran la comprensión de la computadora sobre el habla susurrada y normal.

2025-06-23T08:59:30+00:00 ― 6 minilectura

Sonido Inteligencia Artificial y el Futuro de la Creación Musical

La IA está cambiando cómo se compone y se vive la música.

2025-06-23T08:10:55+00:00 ― 7 minilectura

Procesado de señales BELT-2: Conectando Señales Cerebrales y Lenguaje

Un nuevo modelo busca traducir la actividad cerebral en un lenguaje comprensible.

2025-06-23T07:22:20+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en el modelado de disfluencias del habla con SSDM

Un nuevo enfoque mejora la modelización de la disfusión para la terapia y el aprendizaje de idiomas.

2025-06-23T06:33:45+00:00 ― 6 minilectura

Aprendizaje automático Entendiendo el Recorte por Micro-lotes en Aprendizaje Automático

Una mirada a la recorte de micro-lotes y sus beneficios para el entrenamiento de modelos.

2025-06-23T05:45:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el reconocimiento de voz japonés con técnicas GER

La investigación muestra cómo los LLMs mejoran el reconocimiento automático de voz en japonés.

2025-06-23T04:08:00+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la Verificación de Voces Contra Ataques de Suplantación

Métodos innovadores mejoran la seguridad en los sistemas de reconocimiento de voz.

2025-06-23T01:42:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el reconocimiento de audio a través del aprendizaje multimodal

Un nuevo marco mejora la clasificación de audio aprovechando el conocimiento de dispositivos multimodales.

2025-06-23T00:53:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Sistema Innovador para Reducción de Eco y Ruido

Un nuevo enfoque mejora la claridad de la comunicación al reducir el eco y el ruido de fondo.

2025-06-23T00:05:05+00:00 ― 6 minilectura

Sonido VoxInstruct: Una Nueva Manera de Generar Voz

VoxInstruct combina contenido y estilo para una generación de habla más natural.

2025-06-22T23:16:30+00:00 ― 6 minilectura

Computación y lenguaje Evaluando la Precisión del Reconocimiento Automático de Voz

Una mirada a cómo medir la precisión en los sistemas de reconocimiento de voz con nuevos métodos.

2025-06-22T20:50:45+00:00 ― 6 minilectura

Sonido Avances en la Verificación de Voces Usando Whisper

Un nuevo método mejora la precisión del reconocimiento de voz en varios idiomas.

2025-06-22T18:25:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la Mejora de Voz con Ventanas de Contexto Temporal

Explorando un nuevo enfoque para mejorar la calidad del habla usando ventanas de contexto temporal.

2025-06-22T17:36:25+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en técnicas de marcas de agua de audio digital

Métodos recientes mejoran la marca de agua de audio para una mejor calidad de sonido y gestión de derechos de autor.

2025-06-22T15:59:15+00:00 ― 6 minilectura

Sonido Avances en la Tecnología de Conversión de Voz

Un nuevo método para mejorar la calidad de conversión de voz en tiempo real.

2025-06-22T07:04:50+00:00 ― 7 minilectura

Computación y lenguaje Presentamos SALSA: Un nuevo método para mejorar el ASR

SALSA mejora la precisión del reconocimiento de voz para lenguas de pocos recursos al integrar ASR y modelos de lenguaje.

2025-06-22T06:16:15+00:00 ― 6 minilectura

Sonido Avances en tecnología de texto a voz

Nuevos métodos mejoran la calidad de la síntesis de voz en sistemas TTS.

2025-06-22T05:27:40+00:00 ― 5 minilectura

Computación y lenguaje Evaluando la precisión de ASR para accesibilidad

Examinando el rendimiento del reconocimiento automático de voz para usuarios sordos y con problemas auditivos.

2025-06-22T01:24:45+00:00 ― 13 minilectura

Computación y lenguaje Perfeccionando letras de canciones con un nuevo modelo

Un nuevo modelo transforma textos simples en letras de canciones adecuadas.

2025-06-21T23:47:35+00:00 ― 7 minilectura

Computación y lenguaje El Movimiento de las Vocales en Inglés: Diptongos vs. Monoptongos

Este estudio analiza cómo diftongos y monoftongos difieren en producción y movimiento.

2025-06-21T22:10:25+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el Reconocimiento Automático de Voz con Modelos de Lenguaje

Nuevo método mejora la precisión de ASR usando modelos de lenguaje para mejores transcripciones.

2025-06-21T20:33:15+00:00 ― 4 minilectura

Computación y lenguaje Mejorando la Precisión en el Etiquetado de Hablantes en Conversaciones

Un nuevo sistema corrige errores de identificación de hablantes para tener transcripciones de conversación más claras.

2025-06-21T18:56:05+00:00 ― 9 minilectura

Procesado de Audio y Voz Presentamos SelectTTS: Un método de texto a voz simplificado

SelectTTS simplifica la generación de voz para hablantes desconocidos con una selección de cuadros efectiva.

2025-06-21T18:07:30+00:00 ― 6 minilectura

Sonido Avances en técnicas de mejora de audio

Mejorando la claridad del habla a través de filtros híbridos y redes neuronales.

2025-06-21T17:18:55+00:00 ― 6 minilectura

Sonido AASIST3: Solución Avanzada para Verificación de Voz

AASIST3 mejora la detección de voces falsas en sistemas de verificación de hablantes automáticos.

2025-06-21T16:30:20+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en tecnología de audio: Presentando X-Codec

X-Codec mejora la generación de audio al integrar comprensión semántica en el procesamiento.

2025-06-21T15:41:45+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la tecnología de reconocimiento de gestos

Investigadores mejoran el reconocimiento de gestos usando técnicas de aprendizaje innovadoras.

2025-06-21T12:27:25+00:00 ― 8 minilectura

Procesado de Audio y Voz Control de Ruido Innovador para Obras de Construcción

El sistema portátil reduce el ruido de construcción, mejorando la comodidad de los trabajadores y el bienestar de la comunidad.

2025-06-21T11:38:50+00:00 ― 6 minilectura

Sonido Avances en la tecnología de generación de música a partir de texto

Nuevos modelos como FluxMusic mejoran la creación de música a partir de texto escrito.

2025-06-21T10:50:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Combinando voz y cara para un mejor reconocimiento de identidad

Este artículo habla sobre las ventajas de combinar sistemas de reconocimiento de voz y facial.

2025-06-21T08:24:30+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en la tecnología de reconocimiento de voz audiovisual

Un nuevo modelo mejora el reconocimiento de voz al combinar de manera efectiva las entradas de audio y visuales.

2025-06-21T05:58:45+00:00 ― 6 minilectura

Sonido Avanzando en la detección de la depresión a través del análisis del habla

Nuevos modelos mejoran la precisión en la detección de la depresión a través de grabaciones de voz.

2025-06-21T03:33:00+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en Aprendizaje Auto-Supervisado para Procesamiento de Voz

Un nuevo método mejora el rendimiento del modelo de habla en varias tareas.

2025-06-21T02:44:25+00:00 ― 7 minilectura

Sonido Avanzando en la detección de palabras clave con datos no etiquetados

Un nuevo método mejora la precisión de la detección de palabras clave usando datos de audio sin etiquetar.

2025-06-21T01:55:50+00:00 ― 8 minilectura

Neuronas y cognición Detección automática de deterioro cognitivo leve a través del análisis del habla

Investigaciones muestran que el análisis del habla puede ayudar en la detección temprana del deterioro cognitivo leve.

2025-06-21T01:11:33+00:00 ― 6 minilectura