Informática - Sonido

RSS

Procesado de Audio y Voz Avances en tecnología de lectura de labios a voz

LipVoicer genera un habla clara a partir de videos silenciosos usando métodos avanzados de lectura labial.

2025-10-27T21:27:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando el reconocimiento del habla disártrica con enfoques innovadores

Nuevos métodos buscan mejorar la comunicación para personas con disartria.

2025-10-27T21:01:09+00:00 ― 7 minilectura

Computación y lenguaje Avances en predicciones con múltiples puntuaciones en procesos gaussianos

Nuevo método mejora predicciones al considerar múltiples puntuaciones de expertos.

2025-10-27T19:49:50+00:00 ― 7 minilectura

Computación y lenguaje Evaluando el rendimiento de Whisper en los dialectos árabes

Una mirada a cómo Whisper maneja varios dialectos y acentos árabes.

2025-10-27T13:21:10+00:00 ― 5 minilectura

Computación y lenguaje Video-LLaMA: Un Nuevo Enfoque para Entender Videos

Un programa que combina datos visuales y de audio para mejorar la comprensión de videos.

2025-10-27T11:44:00+00:00 ― 6 minilectura

Computación y lenguaje Avanzando en el reconocimiento de actos de habla en bengalí

Un nuevo método mejora el reconocimiento de actos de habla en bengalí usando análisis de audio y texto.

2025-10-27T10:55:25+00:00 ― 6 minilectura

Sonido Analizando música con BERT: un nuevo enfoque

La investigación explora el potencial de BERT en el análisis musical a nivel de bares.

2025-10-27T07:41:05+00:00 ― 6 minilectura

Informática y sociedad Aprendizaje de matemáticas entretenido para niños pequeños

Un nuevo sistema mejora el aprendizaje de matemáticas en casa a través de interacciones divertidas.

2025-10-27T07:08:49+00:00 ― 7 minilectura

Computación y lenguaje Adaptación Eficiente del Reconocimiento de Voz Usando Datos de Texto

Un nuevo método mejora los modelos de reconocimiento de voz usando solo datos de texto para la adaptación.

2025-10-27T06:52:30+00:00 ― 7 minilectura

Sonido Avanzando la Armonización de Melodías con Contexto Emocional

Un nuevo modelo mejora la armonización de melodías al considerar factores emocionales.

2025-10-26T21:58:05+00:00 ― 7 minilectura

Aprendizaje automático Creación de Danza Innovadora Usando Palabras Sonoras

Nuevos métodos usan onomatopeyas para inspirar movimientos de baile únicos.

2025-10-26T20:20:55+00:00 ― 6 minilectura

Sonido Avances en Sistemas de Contramedidas de Voz

Los investigadores mejoran la detección del habla generada por máquinas usando ajustes en la información de fase.

2025-10-26T17:55:10+00:00 ― 7 minilectura

Computación y lenguaje Avances en la identificación de idiomas con el marco LASR

Un nuevo enfoque mejora la identificación del lenguaje hablado usando aprendizaje auto-supervisado y etiquetas.

2025-10-26T08:12:10+00:00 ― 7 minilectura

Sonido Mejorando el reconocimiento de voz disártrica en árabe

Un nuevo método mejora el reconocimiento de voz para hablantes árabes con disartria.

2025-10-26T07:23:35+00:00 ― 7 minilectura

Computación y lenguaje Herramienta innovadora de reconocimiento de voz para idiomas de bajos recursos

Allophant mejora el reconocimiento de fonemas para idiomas con datos limitados.

2025-10-26T06:35:00+00:00 ― 6 minilectura

Sonido SANGEET: Un Conjunto de Datos Estructurado para Música Hindustaní

Te presentamos SANGEET, un conjunto de datos detallado sobre la música clásica hindustani.

2025-10-26T04:57:50+00:00 ― 5 minilectura

Sonido Abordando el desafío de la detección de audio falso

Un nuevo método busca mejorar la detección de audio falso sin perder el conocimiento previo.

2025-10-25T16:00:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en el reconocimiento de voz no supervisado

Un nuevo marco mejora el estudio de los sistemas de reconocimiento de voz no supervisados.

2025-10-25T13:34:45+00:00 ― 8 minilectura

Sonido Creando melodías a partir de ritmos simples

Este proyecto ayuda a cualquiera a componer música usando ritmos básicos y métodos informáticos avanzados.

2025-10-25T11:57:35+00:00 ― 6 minilectura

Computación y lenguaje Avances en el Aprendizaje Auto-Supervisado para el Reconocimiento de Voz

Los modelos auto-supervisados revelan ideas sobre las distinciones fonéticas y fonémicas en el habla.

2025-10-25T10:20:25+00:00 ― 6 minilectura

Computación y lenguaje Mejorando la responsabilidad policial con tecnología de reconocimiento de voz

La investigación explora el uso de reconocimiento de voz en el análisis de grabaciones de cámaras corporales de la policía.

2025-10-25T07:54:40+00:00 ― 8 minilectura

Sonido Nuevas formas en que las computadoras crean música

Una mirada a cómo las computadoras están cambiando la composición musical.

2025-10-25T04:31:16+00:00 ― 5 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento y la Síntesis Emocional en Modelos de Voz

Nuevas técnicas mejoran la comprensión emocional en tareas de procesamiento de habla.

2025-10-25T01:26:00+00:00 ― 7 minilectura

Sonido LinDiff: Un Salto Adelante en la Síntesis de Voz

El nuevo modelo LinDiff mejora la velocidad y calidad de la síntesis de voz.

2025-10-25T00:37:25+00:00 ― 5 minilectura

Sonido Nuevo método transforma la tecnología de compresión de audio

Un nuevo enfoque para la compresión de audio reduce el tamaño del archivo sin perder calidad.

2025-10-24T18:57:20+00:00 ― 6 minilectura

Sonido Mejorando la claridad del habla en entornos ruidosos

Técnicas para mejorar el reconocimiento de voz en medio de ruido de fondo.

2025-10-24T16:50:20+00:00 ― 7 minilectura

Procesado de Audio y Voz HiddenSinger: Una Nueva Era en la Sintetización de Voz Cantante

HiddenSinger mejora la calidad de la voz cantando usando técnicas avanzadas de IA.

2025-10-24T14:54:25+00:00 ― 7 minilectura

Sonido Avances en la tecnología de conversión de voz electrolaríngea

Nuevos métodos mejoran la claridad del habla para usuarios de electrolaringes.

2025-10-24T13:17:15+00:00 ― 7 minilectura

Sonido Avances innovadores en tecnología de habla electrolaringea

Investigadores combinan características visuales y sonoras para mejorar el habla de los usuarios de electrolaringe.

2025-10-24T12:28:40+00:00 ― 6 minilectura

Procesado de Audio y Voz El impacto de la edad en los sistemas de reconocimiento de voz

Un estudio destaca cómo el envejecimiento afecta el rendimiento de la verificación automática del hablante.

2025-10-24T10:02:55+00:00 ― 6 minilectura

Procesado de Audio y Voz PausaVoz: Avanzando la Tecnología de Texto a Voz

PauseSpeech mejora los sistemas TTS con una voz que suena más natural gracias a pausas mejoradas.

2025-10-24T09:14:20+00:00 ― 6 minilectura

Multimedia Un Nuevo Sistema para hacer Coincidencia de Música y Videos

Esta investigación presenta un sistema para emparejar música con contenido de video de manera efectiva.

2025-10-24T07:37:10+00:00 ― 8 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz en Entornos Ruidosos

Nuevos métodos mejoran el rendimiento del reconocimiento automático de voz en medio del ruido de fondo.

2025-10-24T02:45:40+00:00 ― 7 minilectura

Procesado de Audio y Voz Gestión eficiente de grandes modelos de voz

Un nuevo método optimiza los modelos de voz para un mejor rendimiento con menos recursos.

2025-10-23T21:54:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Nuevo método para evaluación objetiva de audio espacial

Un enfoque nuevo mejora cómo evaluamos la calidad del audio espacial.

2025-10-23T19:28:25+00:00 ― 6 minilectura

Sonido Identificando el habla leída vs. la espontánea en entrevistas

Un estudio sobre cómo distinguir entre el habla leída y la espontánea.

2025-10-23T18:39:50+00:00 ― 6 minilectura

Procesado de Audio y Voz StyleTTS 2: Avanzando la Tecnología de Texto a Voz

Un nuevo modelo mejora el realismo del discurso sintético.

2025-10-23T15:25:30+00:00 ― 9 minilectura

Procesado de Audio y Voz Avances en el seguimiento de fuentes de sonido con PI-RNN

Un nuevo modelo mejora la precisión y eficiencia en el seguimiento de fuentes de sonido.

2025-10-23T10:34:00+00:00 ― 6 minilectura

Computación y lenguaje Presentamos el conjunto de datos ITALIC para el italiano hablado

Un nuevo conjunto de datos mejora la comprensión del lenguaje hablado para el italiano.

2025-10-23T08:56:50+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en modelos de ASR bilingües y con cambio de código

Nuevos métodos mejoran el reconocimiento de voz multilingüe usando fuentes de datos existentes.

2025-10-23T04:05:20+00:00 ― 8 minilectura