Personalizar la tecnología de reconocimiento de emociones mejora la precisión para hablantes diversos.

2025-09-17T04:55:30+00:00 ― 8 minilectura

Sonido Morphing de Identidad Vocal: Una Amenaza a la Seguridad

Un estudio revela amenazas graves en el reconocimiento de voz usando muestras de morfología.

2025-09-17T04:06:55+00:00 ― 6 minilectura

Sonido Batik-juega-Mozart: Un Conjunto de Datos de Piano Completo

Un conjunto de datos detallado que combina las sonatas de Mozart con interpretaciones de piano y anotaciones de expertos.

2025-09-17T03:18:20+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la estimación de tono con aprendizaje auto-supervisado

Un nuevo modelo liviano mejora la estimación de la tonalidad usando técnicas de aprendizaje auto-supervisado.

2025-09-17T00:04:00+00:00 ― 8 minilectura

Sonido Avances en las técnicas de análisis de la estructura musical

Un nuevo enfoque para mejorar la identificación y análisis de segmentos musicales.

2025-09-16T23:15:25+00:00 ― 6 minilectura

Sonido Detectando Canciones Falsas: Un Nuevo Enfoque de Dataset

Nuevos métodos desarrollados para identificar canciones falsas ante la creciente preocupación.

2025-09-16T22:26:50+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Cleancoder

Cleancoder mejora los sistemas ASR al reducir el ruido de fondo para una comprensión del habla más clara.

2025-09-16T21:38:15+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones RADIO: Un Nuevo Enfoque para Hablar Cabezas

RADIO crea caras que hablan de forma realista usando solo una imagen de referencia.

2025-09-16T16:46:45+00:00 ― 7 minilectura

Computación y lenguaje RoDia: Un nuevo conjunto de datos para la identificación de dialectos rumanos

RoDia ofrece muestras de audio súper importantes para identificar dialectos rumanos.

2025-09-16T15:58:10+00:00 ― 6 minilectura

Procesado de Audio y Voz El papel de las señales no verbales en la comunicación

Explorando cómo los gestos y expresiones mejoran nuestra comprensión del idioma hablado.

2025-09-16T08:40:55+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en la detección y localización de eventos de sonido

Explorando nuevos métodos en detección y localización de sonido usando datos sintéticos.

2025-09-16T05:26:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Sistema de simulación de sonido para músicos

Un nuevo sistema ayuda a los músicos a experimentar el sonido en un escenario virtual.

2025-09-16T03:00:50+00:00 ― 8 minilectura

Sonido Avances en la detección de audio parcialmente falsificado

Nuevo método mejora la detección de segmentos de audio falsos en grabaciones.

2025-09-16T01:23:40+00:00 ― 6 minilectura

Sonido Avances en Tecnología Musical: Separando Ritmo y Armonía

Las computadoras están aprendiendo a separar el ritmo y la armonía en la música para aplicaciones creativas.

2025-09-15T23:46:30+00:00 ― 5 minilectura

Procesado de Audio y Voz MuLanTTS: Una Nueva Frontera en Texto a Voz

El MuLanTTS de Microsoft ofrece capacidades de texto a voz en francés que suenan naturales y expresivas.

2025-09-15T22:57:55+00:00 ― 5 minilectura

Sonido Avances en la Tecnología de Monitoreo Acústico del Tráfico

Nuevos conjuntos de datos y métodos mejoran la clasificación de vehículos para una mejor gestión del tráfico.

2025-09-15T13:14:55+00:00 ― 7 minilectura

Sonido Avances en sistemas de reconocimiento de voz automático

Nuevos métodos mejoran la precisión y velocidad en la tecnología de reconocimiento de voz.

2025-09-15T06:46:15+00:00 ― 7 minilectura

Sonido Avances en la síntesis de sonido Foley con aprendizaje automático

Un nuevo sintetizador mejora la generación de efectos de sonido realistas para los medios.

2025-09-15T05:57:40+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando en la estimación de confianza en el reconocimiento automático de voz

Un nuevo enfoque mejora la estimación de confianza en los sistemas de ASR para más precisión.

2025-09-15T03:14:28+00:00 ― 5 minilectura

Sonido Avances en la tecnología de generación de voz

Presentamos un marco para una síntesis de voz más natural y expresiva.

2025-09-15T01:06:10+00:00 ― 7 minilectura

Sonido Clasificando géneros musicales con tecnología

Aprende cómo la tecnología ayuda a clasificar géneros musicales de manera eficiente.

2025-09-14T21:51:50+00:00 ― 7 minilectura

Sonido Nuevo modelo mejora la evaluación de la intensidad de alimentación de los peces

Un enfoque unificado para evaluar la alimentación de peces usando datos de audio y video.

2025-09-14T21:03:15+00:00 ― 6 minilectura

Sonido Avances en la tecnología de cabezas hablantes emocionales

Un nuevo método mejora la creación de videos con cabezas hablantes que expresan emociones.

2025-09-14T15:23:10+00:00 ― 8 minilectura

Aprendizaje automático Desafíos en el uso de Convnets para el diseño de filtros de audio

Este estudio explora problemas con el uso de convnets para la creación de bancos de filtros de audio.

2025-09-14T14:34:35+00:00 ― 6 minilectura

Sonido Avances en modelos de audio y lenguaje

El modelo CLAP conecta el procesamiento de audio y texto para varias aplicaciones.

2025-09-14T13:46:00+00:00 ― 5 minilectura

Computación y lenguaje Avances en Aprendizaje Auto-Supervisado para Tecnologías de Voz en Francés

Un proyecto tiene como objetivo mejorar el procesamiento del habla en francés usando aprendizaje auto-supervisado.

2025-09-14T12:57:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la anotación automática de prosodia

Nuevos métodos mejoran cómo las máquinas reconocen el ritmo y la emoción del habla.

2025-09-14T12:08:50+00:00 ― 8 minilectura

Sonido Nuevo Método para Estimación de Sonido en Entornos Dispersos

Un nuevo enfoque mejora la estimación del sonido en espacios con objetos que disipan.

2025-09-14T06:28:45+00:00 ― 7 minilectura

Sonido El impacto de la indecidibilidad en la producción musical

Examina cómo la indecibilidad influye en la composición y producción musical hoy en día.

2025-09-14T05:40:10+00:00 ― 5 minilectura

Procesado de Audio y Voz Mejorando la diarización de hablantes con modelos de lenguaje

Este artículo explora los avances en la diarización de hablantes usando modelos de lenguaje para mejorar la precisión.

2025-09-14T03:14:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en el reconocimiento de voz para niños

Este estudio mejora la capacidad de los sistemas de reconocimiento de voz para entender el habla de los niños.

2025-09-14T02:25:50+00:00 ― 7 minilectura

Procesado de Audio y Voz El papel del audio en la detección de peatones

Los investigadores están explorando tecnología de detección de audio para mejorar la identificación de peatones en áreas urbanas.

2025-09-14T00:48:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en Técnicas de Grabación de Campo Sonoro

Nuevo método mejora la localización de fuentes de sonido y la separación de campos.

2025-09-13T20:45:45+00:00 ― 7 minilectura

Sonido Avances en la Síntesis de Sonidos Percusivos

Un nuevo método mejora la síntesis del sonido de los tambores al centrarse en los elementos transitorios agudos.

2025-09-13T19:57:10+00:00 ― 7 minilectura

Sonido Creando conjuntos de datos de voz sintética amigables con la privacidad

Los investigadores están desarrollando datos de voz sintética para proteger la privacidad en el reconocimiento de voz.

2025-09-13T15:05:40+00:00 ― 7 minilectura

Procesado de Audio y Voz VoxtLM: Un enfoque unificado para voz y texto

VoxtLM combina reconocimiento de voz, síntesis, generación de texto y continuación en un solo modelo.

2025-09-13T11:02:45+00:00 ― 5 minilectura

Procesado de Audio y Voz PromptASR: Tecnología de Reconocimiento de Voz de Siguiente Nivel

Nuevo sistema mejora el reconocimiento de voz usando indicaciones conscientes del contexto.

2025-09-13T10:14:10+00:00 ― 5 minilectura

Sonido Avances en Modelos de Audio Universal

EnCodecMAE combina el aprendizaje auto-supervisado y códecs de audio para mejorar el rendimiento en tareas de audio.

2025-09-13T09:25:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando el diagnóstico del autismo a través del reconocimiento de sonidos

Un estudio sobre el uso de aprendizaje automático para identificar los sonidos de los niños para la evaluación del TDAH.

2025-09-13T07:48:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Un Nuevo Enfoque para Detectar Palabras Clave

Presentamos un método flexible para reconocer palabras clave en el habla en diferentes idiomas.

2025-09-13T06:11:15+00:00 ― 7 minilectura

Informática - Sonido