Informática - Sonido

RSS

Procesado de Audio y Voz Avances en la detección de patologías vocales

Nuevos métodos mejoran la detección temprana de problemas de voz usando características de la fuente glótica.

2025-09-04T10:02:25+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando el reconocimiento de voz para acentos diversos

Mejorando los modelos de voz para reconocer y adaptarse mejor a diferentes acentos.

2025-09-04T08:25:15+00:00 ― 5 minilectura

Sonido Avances en la Clasificación de Audio Usando DCLS

DCLS mejora el rendimiento de clasificación de audio al aprender las posiciones del núcleo durante el entrenamiento.

2025-09-04T07:36:40+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando el aprendizaje audiovisual con co-augmentación de velocidad

Un nuevo método mejora el aprendizaje automático de datos audio-visuales.

2025-09-04T05:59:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la tecnología de extracción de voz

Presentando nuevos modelos para mejorar la extracción de voz en entornos ruidosos.

2025-09-04T02:45:10+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Adaptación de Bajo Rango

Un nuevo método mejora la eficiencia del reconocimiento de voz utilizando adaptación de bajo rango.

2025-09-04T00:19:25+00:00 ― 6 minilectura

Procesado de señales Un Nuevo Enfoque para Identificar los Síntomas de la Esquizofrenia

Combinando audio, video y texto para mejorar las evaluaciones de salud mental.

2025-09-03T22:42:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz con Nuevas Técnicas

Una mirada a los avances en el reconocimiento de voz para aumentar la velocidad y la precisión.

2025-09-03T21:05:05+00:00 ― 6 minilectura

Computación y lenguaje Cerrando Brechas Lingüísticas en la Salud

Mejorando la comunicación entre doctores y pacientes con tecnologías avanzadas de reconocimiento de voz.

2025-09-03T18:39:20+00:00 ― 7 minilectura

Sonido La melodía de Synthia: Una nueva herramienta para la investigación de audio

La melodía de Synthia ayuda a los investigadores a probar modelos de audio con datos variados.

2025-09-03T14:36:25+00:00 ― 6 minilectura

Computación y lenguaje Abordando Desafíos en el Reconocimiento Automático de Voz de Larga Duración

La investigación se centra en mejorar los sistemas de ASR para audio no segmentado.

2025-09-03T13:47:50+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando la Síntesis Vocal para Audio Realista

La investigación se centra en optimizar sintetizadores para vocalizaciones humanas en diferentes medios.

2025-09-03T09:44:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando en la Verificación del Habla: Abordando la Variabilidad de Sesiones

Un nuevo método mejora la verificación de hablantes al manejar la variabilidad de las sesiones de manera efectiva.

2025-09-03T08:56:20+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz con modelos de lenguaje grandes

Los LLMs mejoran la precisión y la corrección de errores en los sistemas de reconocimiento de voz.

2025-09-03T06:30:35+00:00 ― 6 minilectura

Procesado de Audio y Voz MC-SimCLR: Avanzando en el aprendizaje de sonido y la conciencia de ubicación

Un nuevo método mejora el reconocimiento de sonido y la localización de fuentes sin etiquetas.

2025-09-03T00:50:30+00:00 ― 6 minilectura

Computación y lenguaje HyPoradise: Mejorando la Precisión del Reconocimiento Automático de Voz

Un nuevo estándar para mejorar la precisión del ASR usando modelos de lenguaje.

2025-09-02T23:13:20+00:00 ― 7 minilectura

Computación y lenguaje Avances en la traducción de voz a través del contexto

Nuevos métodos mejoran la traducción de habla al centrarse en la información contextual.

2025-09-02T22:24:45+00:00 ― 6 minilectura

Sonido Avanzando la tecnología de voz con datos de alternancia de código

Un nuevo método mejora el reconocimiento de voz para usuarios que cambian de código.

2025-09-02T21:36:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Aprovechando la detección de sonidos anómalos para mejores resultados

Descubre cómo el análisis de sonido ayuda a identificar problemas en máquinas de manera eficiente.

2025-09-02T20:47:35+00:00 ― 7 minilectura

Computación y lenguaje Avances en la traducción de voz y subtitulado

Este proyecto mejora la traducción de voz en tiempo real y los sistemas de subtitulado automático.

2025-09-02T18:21:50+00:00 ― 5 minilectura

Sonido Nuevas ideas sobre la generalización en redes neuronales

Explorando cómo la agudeza de los mínimos influye en el rendimiento del modelo con datos de audio no vistos.

2025-09-02T15:56:05+00:00 ― 6 minilectura

Sonido Combinando voz y cara para una mejor identificación

Un nuevo método mejora la verificación de hablantes al combinar datos de audio y visuales.

2025-09-02T07:50:15+00:00 ― 6 minilectura

Sonido Transformers en Aprendizaje de Representación Musical

Un estudio sobre el uso de transformadores para un etiquetado y representación musical efectiva.

2025-09-02T07:01:40+00:00 ― 8 minilectura

Multimedia Avances en la localización de altavoces de audio y video

Un nuevo método mejora el seguimiento de hablantes usando datos de audio y visuales.

2025-09-02T06:13:05+00:00 ― 8 minilectura

Sonido Nuevo Método para Analizar la Dificultad de la Música de Piano

Un nuevo enfoque para evaluar la dificultad de la música para piano usando imágenes de partituras.

2025-09-02T05:24:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando las transcripciones de reuniones con el sistema PP-MeT

PP-MeT tiene como objetivo mejorar la precisión en la transcripción de reuniones con varios hablantes.

2025-09-02T04:35:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Un enfoque universal para mejorar el habla

Esta investigación presenta un modelo para mejorar la claridad del habla en diferentes condiciones.

2025-09-02T02:10:10+00:00 ― 6 minilectura

Sonido El auge de los subtítulos automáticos en audio

Explorando los avances en la subtitulación automática de audio y su impacto en la accesibilidad.

2025-09-02T01:21:35+00:00 ― 6 minilectura

Sonido Separación de voz innovadora usando datos de audio y visuales

La investigación presenta un método efectivo para mejorar la claridad del habla en entornos ruidosos.

2025-09-02T00:33:00+00:00 ― 8 minilectura

Aprendizaje automático Avanzando en la coincidencia de estilo de audio con efectos tradicionales

Un nuevo método simplifica la transferencia de estilo de audio utilizando efectos no diferenciables.

2025-09-01T19:41:30+00:00 ― 8 minilectura

Sonido Evaluando la calidad de las interpretaciones de piano generadas por computadora

La investigación examina cómo la música generada por computadora se compara con la interpretación humana a través de pruebas de escucha.

2025-09-01T07:32:45+00:00 ― 9 minilectura

Procesado de Audio y Voz Mejorando el Diseño de Sonido con Polinomios Ultrasféricos

Aprende cómo los polinomios ultrasféricos mejoran la tecnología de audio y la direccionalidad del sonido.

2025-09-01T05:55:35+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando el Reconocimiento de Voz con SSRL

Un nuevo método mejora el reconocimiento de voz usando menos etiquetas y recursos.

2025-09-01T00:15:30+00:00 ― 8 minilectura

Sonido Avances en técnicas de anclaje de texto a audio

Nuevos métodos mejoran la conexión entre descripciones de texto y eventos sonoros.

2025-08-31T16:09:40+00:00 ― 8 minilectura

Procesado de Audio y Voz Detección de dirección del sonido en robots en movimiento

Métodos innovadores mejoran cómo los robots procesan la dirección del sonido mientras se mueven.

2025-08-31T14:32:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la tecnología de formación de haces

Aprende sobre la formación de haces con valores reales y sus beneficios para arreglos de micrófonos.

2025-08-31T12:06:45+00:00 ― 7 minilectura

Sonido Un Nuevo Modelo para la Generación de Música con IA

MusicAOG simplifica la creación y comprensión de la música a través de una representación gráfica innovadora.

2025-08-31T08:52:25+00:00 ― 7 minilectura

Procesado de Audio y Voz Diseñando sistemas MIMO efectivos con arreglos esféricos

Un nuevo marco para combinar micrófonos y altavoces esféricos en estudios de sonido.

2025-08-31T07:15:15+00:00 ― 7 minilectura

Procesado de Audio y Voz Diseñando Sistemas de Audición Efectivos para Robots Humanoides

Un nuevo marco para mejorar la detección de sonido en robots humanoides a través del diseño de arreglos de micrófonos.

2025-08-31T06:26:40+00:00 ― 10 minilectura

Procesado de Audio y Voz Mejorando la acústica de la habitación con sistemas MIMO

Descubre cómo los sistemas MIMO mejoran el análisis de sonido en diferentes entornos.

2025-08-31T02:23:45+00:00 ― 8 minilectura