Este marco mejora la verificación de hablantes usando datos no etiquetados y técnicas de agrupamiento.

2025-11-28T19:26:50+00:00 ― 6 minilectura

Interacción Persona-Ordenador Avances en Sistemas de Reconocimiento de Emociones Usables

Un nuevo marco mejora la detección de emociones usando aprendizaje auto-supervisado.

2025-11-28T14:35:20+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo método para generar sonidos realistas a partir de video

Este enfoque conecta las acciones de video y el sonido usando física para obtener mejores efectos de sonido.

2025-11-28T12:58:10+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando el Reconocimiento de Voz Audiovisual con Pistas Visuales

Un nuevo método mejora el reconocimiento de voz usando datos visuales con modelos existentes.

2025-11-28T10:32:25+00:00 ― 8 minilectura

Inteligencia artificial Un Nuevo Marco para Anotaciones Musicales

Este artículo habla de un enfoque sistemático para la anotación musical.

2025-11-28T06:29:30+00:00 ― 7 minilectura

Inteligencia artificial Entendiendo la Ontología de las Notas Musicales

Un enfoque estructurado para la representación de música y el análisis de rendimiento.

2025-11-28T05:40:55+00:00 ― 6 minilectura

Computación y lenguaje Avanzando Modelos de Habla Visualmente Fundados Bilingües

Este estudio mejora los modelos de habla bilingües usando un buen soporte de idiomas.

2025-11-28T04:03:45+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Creando Imágenes a partir de Sonidos: El Modelo Sound2Scene

Nuevo modelo transforma sonidos en imágenes claras, uniendo información audiovisual.

2025-11-28T03:15:10+00:00 ― 7 minilectura

Procesado de Audio y Voz Nuevo método para la subtitulación de audio con datos limitados

Un enfoque nuevo para generar subtítulos de audio usando modelos de lenguaje preentrenados.

2025-11-28T02:26:35+00:00 ― 7 minilectura

Computación y lenguaje Innovaciones Modulares en Sistemas de Reconocimiento de Voz

Un nuevo enfoque mejora la adaptabilidad de la tecnología de reconocimiento de voz.

2025-11-27T16:43:35+00:00 ― 5 minilectura

Computación y lenguaje Nuevos enfoques en la tecnología de reconocimiento de voz

Una mirada a los avances en los modelos de reconocimiento de voz para mejorar la eficiencia y precisión.

2025-11-27T15:55:00+00:00 ― 6 minilectura

Computación y lenguaje Nuevo método para evaluar sistemas de reconocimiento de voz

Un nuevo enfoque para medir el rendimiento del reconocimiento de voz sin transcripción manual.

2025-11-26T22:06:10+00:00 ― 6 minilectura

Computación y lenguaje Anonimización de voz en diagnósticos de COVID-19: equilibrando la privacidad y la precisión

Examinando cómo la anonimización de voz afecta a los sistemas de diagnóstico de COVID-19 y la privacidad del usuario.

2025-11-26T01:03:00+00:00 ― 9 minilectura

Interacción Persona-Ordenador Revolucionando la batería: El sistema de air drumming

Experimenta tocar la batería solo con dos baquetas y un smartphone, no necesitas equipo pesado.

2025-11-25T21:48:40+00:00 ― 6 minilectura

Interacción Persona-Ordenador Cómo la IA está cambiando la mezcla de música

Las herramientas de IA simplifican la mezcla, ofreciendo nuevas opciones tanto para aficionados como para profesionales.

2025-11-24T20:42:35+00:00 ― 8 minilectura

Sonido Burbujas en el Agua: Una Nueva Frontera Sonora

Las burbujas pueden tener la clave para generar música innovadora.

2025-11-24T18:42:00+00:00 ― 8 minilectura

Sonido Avances en la subtitulación automática de audio

Una mirada a nuevos métodos que mejoran la subtitulación de audio para una mejor accesibilidad.

2025-11-24T10:11:00+00:00 ― 5 minilectura

Informática y sociedad Biometría de voz: Conjuntos de datos, sesgos y desafíos de privacidad

Analizar el uso de conjuntos de datos en biometría de voz revela preocupaciones importantes sobre sesgos y privacidad.

2025-11-24T06:56:40+00:00 ― 8 minilectura

Procesado de Audio y Voz Mejorando la Verificación de Hablantes con Margin-Mixup

Un nuevo método mejora los sistemas de verificación de voz para voces superpuestas.

2025-11-24T01:16:35+00:00 ― 6 minilectura

Aprendizaje automático Nuevas técnicas para el procesamiento del habla

Métodos innovadores para una representación efectiva de segmentos de habla en tareas de procesamiento.

2025-11-23T14:45:00+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando la Síntesis de Voz con Predicción de Pausas

Mejorando los sistemas de TTS para contar historias mejor con pausas efectivas.

2025-11-23T09:53:30+00:00 ― 5 minilectura

Sonido AffectMachine-Clásico: Una Nueva Manera de Crear Música Emocional

AffectMachine-Clásico genera música clásica en tiempo real para ayudar a manejar las emociones.

2025-11-23T06:39:10+00:00 ― 8 minilectura

Sonido Impacto de los sistemas TTS en la traducción de voz a voz

Este estudio examina cómo diferentes sistemas de TTS mejoran el rendimiento del modelo S2ST.

2025-11-23T02:36:15+00:00 ― 7 minilectura

Computación y lenguaje Modelando Canales Secundarios: Un Paso Hacia Conversaciones Naturales

La investigación revela cómo los canales secundarios mejoran la comunicación entre máquinas.

2025-11-23T01:47:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la manipulación de audio usando redes neuronales

Investigaciones muestran nuevas formas de manipular el sonido usando redes neuronales para la producción musical.

2025-11-23T00:10:30+00:00 ― 6 minilectura

Sonido Mejorando el Aprendizaje Audiovisual con Películas Dobladas

La investigación usa películas dobladas para mejorar la conexión entre la vista y el sonido en el aprendizaje automático.

2025-11-22T07:58:50+00:00 ― 6 minilectura

Procesado de Audio y Voz Una nueva forma de analizar los sonidos del habla a lo largo del tiempo

Presentando el absement, un método para medir los sonidos del habla de manera dinámica a lo largo del tiempo.

2025-11-22T03:07:20+00:00 ― 7 minilectura

Sonido Avances en Métodos de Transcripción de Canto

Un nuevo enfoque para transcribir con precisión las notas y letras de canciones usando tecnología.

2025-11-22T01:30:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Nuevo modelo mejora el reconocimiento de emociones en conversaciones

El modelo de atención cruzada jerárquica mejora la comprensión emocional en diversas formas de comunicación.

2025-11-21T19:01:30+00:00 ― 6 minilectura

Sonido Avances en Sistemas de Recuperación Musical

Nuevos métodos mejoran el etiquetado y la recuperación de música usando menos input humano.

2025-11-21T06:52:45+00:00 ― 7 minilectura

Sonido Analizando las longitudes de las señales en modelos de separación de voz

Este estudio examina cómo la longitud de la señal afecta el rendimiento en la separación del habla.

2025-11-21T04:27:00+00:00 ― 7 minilectura

Robótica Usando el ruido de los drones para medir distancias

Nuevo método estima distancias usando el ruido de los motores de drones.

2025-11-21T00:24:05+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Avanzando en el Reconocimiento de Emociones con Datos Audio-Visuales

Esta investigación destaca un nuevo modelo para mejorar el reconocimiento de emociones usando datos de audio y visuales.

2025-11-20T21:09:45+00:00 ― 6 minilectura

Computación y lenguaje Máquinas y Sonidos: ¿Puede la IA Entender Descripciones Auditivas?

Este estudio analiza cómo la IA clasifica y describe los sonidos en comparación con los humanos.

2025-11-20T19:32:35+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la tecnología de mejora de voz

FSB-LSTM mejora la claridad del habla en entornos ruidosos con baja latencia y poca complejidad.

2025-11-20T12:15:20+00:00 ― 7 minilectura

Procesado de Audio y Voz Optimizando la detección de palabras clave para mejor eficiencia energética

La investigación revela formas de mejorar los sistemas de detección de palabras clave mientras se reduce el consumo de energía.

2025-11-20T11:26:45+00:00 ― 6 minilectura

Computación y lenguaje Presentamos Prak: Una Herramienta para la Alineación Fonética

Prak simplifica la alineación fonética para la investigación en lengua checa.

2025-11-20T10:38:10+00:00 ― 5 minilectura

Geofísica Avanzando en el Monitoreo Sísmico con la Técnica DAS-N2N

DAS-N2N usa aprendizaje automático para mejorar la recolección de datos sísmicos reduciendo el ruido.

2025-11-20T00:13:15+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en Modelos de Reconocimiento de Voz Unificada

Nuevas técnicas mejoran la precisión en el reconocimiento de voz en tiempo real y fuera de línea.

2025-11-19T23:18:00+00:00 ― 6 minilectura

Sonido Avances en la Generación Simbólica de Música Usando Tokenización de Subpalabras

Este estudio resalta cómo la tokenización de subpalabras mejora la calidad y eficiencia de la generación musical.

2025-11-19T20:03:40+00:00 ― 8 minilectura

Informática - Sonido