Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

RSS

Computación y lenguaje Avances en la tecnología de procesamiento de voz en tiempo real

Un nuevo sistema combina transcripción y traducción para mejorar la comunicación.

2025-10-12T11:24:25+00:00 ― 5 minilectura

Sonido Avances en el reconocimiento de voz con Whisper-AT

Whisper-AT combina el reconocimiento de voz y el etiquetado de audio para un mejor rendimiento.

2025-10-12T08:10:05+00:00 ― 7 minilectura

Procesado de Audio y Voz Integrando el habla con modelos de lenguaje: El método Speech-LLaMA

Un nuevo enfoque que combina el habla con modelos de lenguaje para mejorar la traducción.

2025-10-11T18:24:10+00:00 ― 5 minilectura

Sonido Avances en la Transcripción Automática de Pianos

Nuevo método mejora la precisión al convertir audio de piano en partituras.

2025-10-11T14:21:15+00:00 ― 5 minilectura

Procesado de Audio y Voz El paisaje en evolución de la IA de audio generativo

Este artículo habla de las necesidades y desafíos en la tecnología de audio generativo.

2025-10-11T13:32:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la detección de tuberculosis a través del análisis de la tos

Nuevos métodos usan los sonidos de la tos y datos de salud para detectar mejor la tuberculosis.

2025-10-11T09:29:45+00:00 ― 7 minilectura

Procesado de Audio y Voz Cambios de voz en pacientes con cáncer oral durante el tratamiento

Este estudio examina cómo evolucionan las características de la voz en pacientes con cáncer oral después del tratamiento.

2025-10-11T08:41:10+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando la Transferencia de Timbre con DiffTransfer

Un nuevo método para cambiar el timbre musical usando técnicas avanzadas de aprendizaje automático.

2025-10-11T07:52:35+00:00 ― 5 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz con RNN-Transductores

Nuevos métodos mejoran la precisión del reconocimiento de voz, solucionando errores comunes de transcripción.

2025-10-11T04:38:15+00:00 ― 5 minilectura

Sonido Avances en la síntesis de voz articulatoria

Un estudio sobre cómo mejorar la reproducción del sonido vocal con técnicas de síntesis avanzadas.

2025-10-11T02:12:30+00:00 ― 7 minilectura

Sonido Presentamos VampNet: Una Nueva Forma de Crear Música

VampNet transforma el procesamiento de música a través de técnicas innovadoras de modelado de tokens.

2025-10-11T01:23:55+00:00 ― 5 minilectura

Sonido EchoVest: Una Nueva Esperanza para la Pérdida Auditiva

Tecnología portátil asequible para personas con pérdida auditiva.

2025-10-10T23:46:45+00:00 ― 6 minilectura

Sonido Avanzando la alineación de letras en servicios de música

Un nuevo modelo mejora la precisión de tiempo para las letras en aplicaciones de música.

2025-10-10T18:55:15+00:00 ― 7 minilectura

Interacción Persona-Ordenador Presentamos SnakeSynth: Una Nueva Forma de Crear Sonido

Un sintetizador en línea que permite a los usuarios crear música usando gestos simples.

2025-10-10T16:29:30+00:00 ― 5 minilectura

Sonido IA y Creatividad en la Música Metal Progresivo

Un estudio sobre el papel de la IA en la generación de música metal progresivo.

2025-10-10T13:15:10+00:00 ― 7 minilectura

Sonido ShredGP: Una Nueva Forma de Generar Música de Guitarra

Un modelo que crea tablaturas de guitarra reflejando los estilos de guitarristas famosos.

2025-10-10T12:26:35+00:00 ― 7 minilectura

Sonido Avances en Aprendizaje Auto-Supervisado para Análisis Musical

Explorando el potencial del aprendizaje auto-supervisado en la recuperación de información musical.

2025-10-10T10:00:50+00:00 ― 7 minilectura

Sonido Análisis de audio en la detección de COVID-19

Usando señales de audio para identificar riesgos de salud respiratoria.

2025-10-10T09:12:15+00:00 ― 9 minilectura

Computación y lenguaje ResumenMezcla: Un Nuevo Enfoque para el Reconocimiento de Voz

Un nuevo método mejora la velocidad y precisión del reconocimiento de voz mientras reduce el uso de recursos.

2025-10-10T07:35:05+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en bioacústica a través de incrustaciones de características

Este estudio mejora el monitoreo de la fauna usando embeddings de características de audio para una mejor clasificación de sonidos.

2025-10-10T02:43:35+00:00 ― 10 minilectura

Procesado de Audio y Voz Avances en la Conversión de Voz con Tecnología Urhythmic

Urhythmic mejora la conversión de voz al centrarse en el ritmo del habla.

2025-10-09T21:52:05+00:00 ― 6 minilectura

Sonido Avances en la Recuperación de Información Musical en Tiempo Real para Guitarristas

La investigación mejora las técnicas de fingerstyle percutivo para guitarristas usando recuperación de sonido en tiempo real.

2025-10-09T15:23:25+00:00 ― 9 minilectura

Computación y lenguaje Avances en la Clasificación de Intenciones del Habla y Relleno de Slots

Este artículo explora un nuevo modelo para la identificación de intención de habla y slots.

2025-10-09T12:09:05+00:00 ― 7 minilectura

Sonido Detectando la verdad en voces sintéticas

A medida que la tecnología de clonación de voz avanza, los métodos de detección confiables son cruciales.

2025-10-09T06:29:00+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en el reconocimiento de voz sin texto

Nuevo método mejora el reconocimiento de voz usando solo datos de audio en bruto.

2025-10-09T02:26:05+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz para Adultos Mayores

Un estudio mejora el reconocimiento de voz para personas mayores, usando técnicas innovadoras.

2025-10-09T01:37:30+00:00 ― 7 minilectura

Computación y lenguaje Avances en la Resumición de Habla con BASS

BASS mejora la resumición de audios largos procesando en bloques.

2025-10-08T15:05:55+00:00 ― 6 minilectura

Sonido Riesgos de ataques encubiertos en sistemas de reconocimiento de voz

Nuevos métodos plantean serios riesgos de seguridad para la tecnología de reconocimiento de voz.

2025-10-08T14:17:20+00:00 ― 8 minilectura

Procesado de Audio y Voz Nuevo conjunto de datos busca mejorar el reconocimiento de voz en hebreo

ivrit.ai ofrece recursos clave para mejorar la tecnología de ASR en hebreo.

2025-10-08T05:22:55+00:00 ― 8 minilectura

Computación y lenguaje Avances en la tecnología de traducción de voz multilingüe

Técnicas innovadoras están cambiando la forma en que traducimos el lenguaje hablado.

2025-10-08T02:57:10+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en técnicas de anonimización de hablantes

Nuevos métodos buscan ocultar las identidades de los hablantes mientras mantienen la claridad del habla.

2025-10-08T01:20:00+00:00 ― 6 minilectura

Sonido Avanzando en el Reconocimiento de Voz con Transductores Espaciados en el Tiempo

Nuevo modelo mejora la velocidad de reconocimiento de voz y el uso de memoria.

2025-10-07T23:42:50+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la tecnología de reconocimiento de voz sensible al dominio

Nuevos métodos mejoran el reconocimiento de voz en campos específicos sin necesidad de mucha data.

2025-10-07T15:37:00+00:00 ― 7 minilectura

Sonido Presentamos el Dataset JAZZVAR para Variaciones de Piano Jazz

Un nuevo conjunto de datos resalta las interpretaciones creativas de los pianistas de jazz sobre los clásicos.

2025-10-07T14:48:25+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en el modelado de HRTF para un sonido realista

Nuevos métodos mejoran la representación del sonido en la realidad virtual y aumentada.

2025-10-07T10:45:30+00:00 ― 8 minilectura

Sonido FlexiAST: Un Enfoque Flexible para el Procesamiento de Audio

FlexiAST permite que los modelos se adapten de manera eficiente a diferentes tamaños de parches de audio.

2025-10-07T09:56:55+00:00 ― 7 minilectura

Aprendizaje automático Avances en el Análisis del Habla para la Detección del Cáncer de Garganta

Los investigadores están usando aprendizaje automático para mejorar el diagnóstico de cáncer de garganta a través del análisis del habla.

2025-10-07T06:42:35+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en Embeddings Acústicos de Palabras

Un nuevo modelo mejora la forma en que las computadoras procesan el lenguaje hablado.

2025-10-07T04:16:50+00:00 ― 5 minilectura

Sonido Presentamos Polyffusion: Una nueva forma de crear partituras musicales

Polyffusion usa técnicas visuales para generar y controlar música de manera efectiva.

2025-10-07T01:51:05+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la detección del Alzheimer a través del análisis del habla

Los investigadores están usando patrones de habla para detectar el Alzheimer más temprano y de manera más efectiva.

2025-10-07T00:13:55+00:00 ― 7 minilectura