Informática - Sonido

RSS

Sonido Avanzando la simulación de sonido con BEDRF

Un nuevo modelo mejora la difracción del sonido en entornos virtuales.

2025-10-29T01:47:25+00:00 ― 8 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Sesgo Contextual

El sesgo contextual mejora los sistemas de reconocimiento de voz, aumentando la precisión en tareas especializadas.

2025-10-29T00:58:50+00:00 ― 6 minilectura

Sonido Nuevo método para mejorar la detección de la pronunciación del idioma

Este estudio presenta un nuevo sistema para detectar errores de pronunciación en los estudiantes de idiomas.

2025-10-28T21:44:30+00:00 ― 7 minilectura

Sonido Un Nuevo Enfoque para el Reordenamiento de la Música

El sistema Q A usa aprendizaje auto-supervisado para una reordenación innovadora de música.

2025-10-28T20:07:20+00:00 ― 6 minilectura

Sonido Mejorando la síntesis de habla expresiva con TVC-GMM

Un nuevo método mejora la calidad del texto a voz y la expresión emocional.

2025-10-28T18:30:10+00:00 ― 5 minilectura

Procesado de Audio y Voz Avanzando el reconocimiento de voz con modelos más pequeños

Están surgiendo técnicas para reducir el tamaño del modelo sin perder rendimiento.

2025-10-28T15:15:50+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en Efectos de Fase Digital

Nuevo modelo imita efectos de fase analógica con técnicas de aprendizaje mejoradas.

2025-10-28T12:50:05+00:00 ― 6 minilectura

Computación y lenguaje Avanzando en el reconocimiento de voz multilingüe con DistilXLSR

Un nuevo modelo reduce el tamaño mientras mejora el reconocimiento de voz multilingüe.

2025-10-28T11:12:55+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz para acentos diversos

Un nuevo método mejora la precisión del reconocimiento de voz para acentos africanos.

2025-10-28T09:35:45+00:00 ― 6 minilectura

Computación y lenguaje Avances en el Reconocimiento de Voz para Múltiples Hablantes

Un nuevo sistema mejora el reconocimiento de voz en entornos con múltiples hablantes.

2025-10-28T00:41:20+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en tecnología de lectura de labios a voz

LipVoicer genera un habla clara a partir de videos silenciosos usando métodos avanzados de lectura labial.

2025-10-27T21:27:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando el reconocimiento del habla disártrica con enfoques innovadores

Nuevos métodos buscan mejorar la comunicación para personas con disartria.

2025-10-27T21:01:09+00:00 ― 7 minilectura

Computación y lenguaje Avances en predicciones con múltiples puntuaciones en procesos gaussianos

Nuevo método mejora predicciones al considerar múltiples puntuaciones de expertos.

2025-10-27T19:49:50+00:00 ― 7 minilectura

Computación y lenguaje Evaluando el rendimiento de Whisper en los dialectos árabes

Una mirada a cómo Whisper maneja varios dialectos y acentos árabes.

2025-10-27T13:21:10+00:00 ― 5 minilectura

Computación y lenguaje Video-LLaMA: Un Nuevo Enfoque para Entender Videos

Un programa que combina datos visuales y de audio para mejorar la comprensión de videos.

2025-10-27T11:44:00+00:00 ― 6 minilectura

Computación y lenguaje Avanzando en el reconocimiento de actos de habla en bengalí

Un nuevo método mejora el reconocimiento de actos de habla en bengalí usando análisis de audio y texto.

2025-10-27T10:55:25+00:00 ― 6 minilectura

Sonido Analizando música con BERT: un nuevo enfoque

La investigación explora el potencial de BERT en el análisis musical a nivel de bares.

2025-10-27T07:41:05+00:00 ― 6 minilectura

Informática y sociedad Aprendizaje de matemáticas entretenido para niños pequeños

Un nuevo sistema mejora el aprendizaje de matemáticas en casa a través de interacciones divertidas.

2025-10-27T07:08:49+00:00 ― 7 minilectura

Computación y lenguaje Adaptación Eficiente del Reconocimiento de Voz Usando Datos de Texto

Un nuevo método mejora los modelos de reconocimiento de voz usando solo datos de texto para la adaptación.

2025-10-27T06:52:30+00:00 ― 7 minilectura

Sonido Avanzando la Armonización de Melodías con Contexto Emocional

Un nuevo modelo mejora la armonización de melodías al considerar factores emocionales.

2025-10-26T21:58:05+00:00 ― 7 minilectura

Aprendizaje automático Creación de Danza Innovadora Usando Palabras Sonoras

Nuevos métodos usan onomatopeyas para inspirar movimientos de baile únicos.

2025-10-26T20:20:55+00:00 ― 6 minilectura

Sonido Avances en Sistemas de Contramedidas de Voz

Los investigadores mejoran la detección del habla generada por máquinas usando ajustes en la información de fase.

2025-10-26T17:55:10+00:00 ― 7 minilectura

Computación y lenguaje Avances en la identificación de idiomas con el marco LASR

Un nuevo enfoque mejora la identificación del lenguaje hablado usando aprendizaje auto-supervisado y etiquetas.

2025-10-26T08:12:10+00:00 ― 7 minilectura

Sonido Mejorando el reconocimiento de voz disártrica en árabe

Un nuevo método mejora el reconocimiento de voz para hablantes árabes con disartria.

2025-10-26T07:23:35+00:00 ― 7 minilectura

Computación y lenguaje Herramienta innovadora de reconocimiento de voz para idiomas de bajos recursos

Allophant mejora el reconocimiento de fonemas para idiomas con datos limitados.

2025-10-26T06:35:00+00:00 ― 6 minilectura

Sonido SANGEET: Un Conjunto de Datos Estructurado para Música Hindustaní

Te presentamos SANGEET, un conjunto de datos detallado sobre la música clásica hindustani.

2025-10-26T04:57:50+00:00 ― 5 minilectura

Sonido Abordando el desafío de la detección de audio falso

Un nuevo método busca mejorar la detección de audio falso sin perder el conocimiento previo.

2025-10-25T16:00:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en el reconocimiento de voz no supervisado

Un nuevo marco mejora el estudio de los sistemas de reconocimiento de voz no supervisados.

2025-10-25T13:34:45+00:00 ― 8 minilectura

Sonido Creando melodías a partir de ritmos simples

Este proyecto ayuda a cualquiera a componer música usando ritmos básicos y métodos informáticos avanzados.

2025-10-25T11:57:35+00:00 ― 6 minilectura

Computación y lenguaje Avances en el Aprendizaje Auto-Supervisado para el Reconocimiento de Voz

Los modelos auto-supervisados revelan ideas sobre las distinciones fonéticas y fonémicas en el habla.

2025-10-25T10:20:25+00:00 ― 6 minilectura

Computación y lenguaje Mejorando la responsabilidad policial con tecnología de reconocimiento de voz

La investigación explora el uso de reconocimiento de voz en el análisis de grabaciones de cámaras corporales de la policía.

2025-10-25T07:54:40+00:00 ― 8 minilectura

Sonido Nuevas formas en que las computadoras crean música

Una mirada a cómo las computadoras están cambiando la composición musical.

2025-10-25T04:31:16+00:00 ― 5 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento y la Síntesis Emocional en Modelos de Voz

Nuevas técnicas mejoran la comprensión emocional en tareas de procesamiento de habla.

2025-10-25T01:26:00+00:00 ― 7 minilectura

Sonido LinDiff: Un Salto Adelante en la Síntesis de Voz

El nuevo modelo LinDiff mejora la velocidad y calidad de la síntesis de voz.

2025-10-25T00:37:25+00:00 ― 5 minilectura

Sonido Nuevo método transforma la tecnología de compresión de audio

Un nuevo enfoque para la compresión de audio reduce el tamaño del archivo sin perder calidad.

2025-10-24T18:57:20+00:00 ― 6 minilectura

Sonido Mejorando la claridad del habla en entornos ruidosos

Técnicas para mejorar el reconocimiento de voz en medio de ruido de fondo.

2025-10-24T16:50:20+00:00 ― 7 minilectura

Procesado de Audio y Voz HiddenSinger: Una Nueva Era en la Sintetización de Voz Cantante

HiddenSinger mejora la calidad de la voz cantando usando técnicas avanzadas de IA.

2025-10-24T14:54:25+00:00 ― 7 minilectura

Sonido Avances en la tecnología de conversión de voz electrolaríngea

Nuevos métodos mejoran la claridad del habla para usuarios de electrolaringes.

2025-10-24T13:17:15+00:00 ― 7 minilectura

Sonido Avances innovadores en tecnología de habla electrolaringea

Investigadores combinan características visuales y sonoras para mejorar el habla de los usuarios de electrolaringe.

2025-10-24T12:28:40+00:00 ― 6 minilectura

Procesado de Audio y Voz El impacto de la edad en los sistemas de reconocimiento de voz

Un estudio destaca cómo el envejecimiento afecta el rendimiento de la verificación automática del hablante.

2025-10-24T10:02:55+00:00 ― 6 minilectura