Informática - Sonido

Sonido Avances en sistemas de reconocimiento de emociones en el habla

Nuevos modelos están cambiando la forma en que analizamos las emociones en el habla.

2025-09-12T07:30:55+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Reconocimiento de acciones con tecnología de ultrasonido priorizando la privacidad

Un nuevo método usa ultrasonido para reconocer acciones mientras protege la privacidad.

2025-09-12T06:42:20+00:00 ― 6 minilectura

Sonido Un Nuevo Marco para la Anonimización de Voces

Presentamos un marco flexible para mejorar la investigación sobre la privacidad de la voz.

2025-09-12T05:05:10+00:00 ― 8 minilectura

Sonido CiwaGAN: Un Nuevo Modelo para el Aprendizaje del Habla

CiwaGAN combina el control de los movimientos del habla y el intercambio de información para un mejor aprendizaje del habla.

2025-09-12T04:16:35+00:00 ― 8 minilectura

Computación y lenguaje IntraVerbalPA: Un Nuevo Enfoque para la Evaluación de la Pronunciación

Un marco que mezcla señales verbales y no verbales para mejorar el aprendizaje de idiomas.

2025-09-12T03:28:00+00:00 ― 7 minilectura

Computación y lenguaje Mejorando las explicaciones para modelos de voz

Un nuevo método simplifica la comprensión de los modelos de clasificación de voz.

2025-09-12T02:39:25+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el aprendizaje de idiomas con L1-MultiMDD

Un nuevo sistema mejora las habilidades de pronunciación al tener en cuenta las influencias del idioma materno.

2025-09-12T01:50:50+00:00 ― 6 minilectura

Tecnologías emergentes La computación cuántica y la composición musical

Descubre cómo las herramientas cuánticas cambian la creación y la interpretación de la música.

2025-09-12T00:31:30+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en la tecnología de conversión de voz

Nuevo método mejora la preservación de emociones en los procesos de conversión de voz.

2025-09-12T00:13:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Emo-StarGAN: Avanzando la Tecnología de Conversión de Voz

Nuevo método preserva el tono emocional en la conversión de voz para mejorar la interacción humano-computadora.

2025-09-11T23:25:05+00:00 ― 7 minilectura

Computación y lenguaje Avances en la Traducción Directa de Texto a Voz

Nuevos sistemas mejoran la traducción de texto a lenguaje hablado sin intermediarios.

2025-09-11T20:59:20+00:00 ― 5 minilectura

Procesado de Audio y Voz Mejorando la clasificación de sonidos cardíacos con aumento de datos

Los investigadores mejoran la precisión en la clasificación de sonidos del corazón usando métodos de aumento de datos con códec.

2025-09-11T19:22:10+00:00 ― 7 minilectura

Sonido Los desafíos emocionales en el discurso ponen a prueba los modelos de separación de sonidos

La investigación revela que el habla emocional afecta el rendimiento del modelo en tareas de separación de voz.

2025-09-11T18:33:35+00:00 ― 8 minilectura

Sonido M-AUDIODEC: Una nueva forma de comprimir audio

M-AUDIODEC comprime audio multicanal manteniendo la posición de los altavoces y la calidad.

2025-09-11T16:56:25+00:00 ― 7 minilectura

Sonido Avances en la tecnología de traducción de voz a voz

Nuevos métodos en S2ST mejoran la calidad de la traducción manteniendo la identidad del hablante.

2025-09-11T16:07:50+00:00 ― 6 minilectura

Sonido Avanzando en la compresión de audio con técnicas neuronales

Un nuevo sistema mejora la compresión de audio espacial para un sonido más claro y eficiente.

2025-09-11T15:19:15+00:00 ― 5 minilectura

Procesado de Audio y Voz MusiLingo: Uniendo Música y Lenguaje

Un nuevo sistema que conecta la música y el lenguaje para una mejor comprensión.

2025-09-11T14:30:40+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando la Calidad de Sonido en Audífonos

La investigación revela nuevos modelos para mejorar la claridad del sonido en los auriculares inteligentes.

2025-09-11T12:04:55+00:00 ― 6 minilectura

Sonido Mejorando el reconocimiento de sonidos de aves con metadatos

Usar información extra mejora nuestra capacidad para identificar los cantos de los pájaros.

2025-09-11T11:16:20+00:00 ― 7 minilectura

Sonido Mejorando la Generación de Audio a Través de Técnicas de Alineación de Texto

Un nuevo enfoque mejora la generación de audio alineando el audio con descripciones de texto.

2025-09-11T07:13:25+00:00 ― 6 minilectura

Computación y lenguaje Avances en la tecnología de reconocimiento de voz

Los investigadores trabajan para mejorar el reconocimiento de voz en línea usando modelos de espacio de estados estructurados.

2025-09-11T04:47:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Detección de hablantes en tiempo real para reuniones modernas

Un nuevo sistema mejora las experiencias de las reuniones al identificar a los hablantes en tiempo real.

2025-09-11T03:10:30+00:00 ― 5 minilectura

Procesado de Audio y Voz Avanzando en las técnicas de detección de discursos falsos

Nuevos métodos están mejorando nuestra capacidad para detectar discursos falsos de manera efectiva.

2025-09-11T02:21:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Anonimizando Datos de Voz: Un Nuevo Enfoque

Un método para la conversión de voz que mejora la privacidad y la calidad del habla.

2025-09-11T01:33:20+00:00 ― 8 minilectura

Sonido Avances en los sistemas de detección de deepfakes de audio

Nuevos métodos mejoran la capacidad de distinguir audio falso de real.

2025-09-10T22:19:00+00:00 ― 7 minilectura

Sonido Nuevo método para detectar voz sintética

Un método mejora la detección de voces sintéticas y identifica a sus creadores.

2025-09-10T20:41:50+00:00 ― 6 minilectura

Sonido Avances en Modelos Pequeños de Mejora de Voz

Nuevos métodos mejoran modelos pequeños para una mejor mejora de voz usando menos recursos.

2025-09-10T19:53:15+00:00 ― 7 minilectura

Sonido Mejorando el reconocimiento de voz con técnicas de personalización

Un nuevo método mejora los modelos de ASR para usuarios individuales usando cuantización y adaptación.

2025-09-10T13:24:35+00:00 ― 7 minilectura

Sonido Mejorando el entrenamiento de Vocoder con aprendizaje contrastivo

Nuevos métodos mejoran el rendimiento del vocoder con datos de audio limitados.

2025-09-10T12:36:00+00:00 ― 6 minilectura

Sonido Entendiendo la Disartria: Perspectivas sobre el Trastorno del Habla

Una mirada a la disartria, su detección y el papel de la tecnología.

2025-09-10T06:55:55+00:00 ― 7 minilectura

Sonido Mejorando el Reconocimiento de Voz con Prompts Suaves

Los soft prompts mejoran la tecnología de reconocimiento de voz para un mejor rendimiento en ambientes ruidosos.

2025-09-10T04:30:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la inversión de voz a través del aprendizaje auto-supervisado

La investigación combina aprendizaje auto-supervisado y nuevas técnicas de medición para mejorar la inversión del habla.

2025-09-10T01:15:50+00:00 ― 7 minilectura

Sonido Mejorando la claridad en el habla electrolaríngea

Los investigadores desarrollan un nuevo marco para mejorar la claridad del habla para los usuarios de electrolaringe.

2025-09-09T22:50:05+00:00 ― 6 minilectura

Criptografía y seguridad Mejorando la detección de deepfakes mediante métodos de entrenamiento diversos

Este estudio explora estrategias de entrenamiento para mejorar la detección de audio falso.

2025-09-09T22:01:30+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en el Reconocimiento de Voz a través de Modelos de Salida Temprana

Nuevos modelos se adaptan para mejorar la eficiencia y la rapidez del reconocimiento de voz.

2025-09-09T21:12:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Presentamos RECAP: Una Nueva Frontera en el Subtitulaje de Audio

RECAP usa técnicas avanzadas para generar subtítulos de audio precisos sin necesidad de reentrenar.

2025-09-09T20:24:20+00:00 ― 6 minilectura

Sonido Fundamentos de la Teoría Musical y Armonía

Una guía práctica para entender la teoría musical a través de la armonía y las escalas.

2025-09-09T16:21:25+00:00 ― 9 minilectura

Procesado de Audio y Voz Mejorando los sistemas ASR con datos sintéticos

Un nuevo método utiliza datos sintéticos para mejorar los sistemas de ASR en áreas desconocidas.

2025-09-09T15:32:50+00:00 ― 7 minilectura

Sonido Estimando la Densidad de Multitudes con Sonido Mientras se Protege la Privacidad

Un nuevo método basado en audio estima el tamaño de las multitudes sin invadir la privacidad personal.

2025-09-09T13:55:40+00:00 ― 5 minilectura

Computación y lenguaje Avanzando en el Reconocimiento de Voz: Sistemas que Siguen Instrucciones

Un nuevo enfoque para el reconocimiento de voz mejora la interacción del usuario con instrucciones flexibles.

2025-09-09T08:15:35+00:00 ― 5 minilectura