Los LLMs mejoran la precisión y la corrección de errores en los sistemas de reconocimiento de voz.

2025-09-03T06:30:35+00:00 ― 6 minilectura

Procesado de Audio y Voz MC-SimCLR: Avanzando en el aprendizaje de sonido y la conciencia de ubicación

Un nuevo método mejora el reconocimiento de sonido y la localización de fuentes sin etiquetas.

2025-09-03T00:50:30+00:00 ― 6 minilectura

Computación y lenguaje HyPoradise: Mejorando la Precisión del Reconocimiento Automático de Voz

Un nuevo estándar para mejorar la precisión del ASR usando modelos de lenguaje.

2025-09-02T23:13:20+00:00 ― 7 minilectura

Computación y lenguaje Avances en la traducción de voz a través del contexto

Nuevos métodos mejoran la traducción de habla al centrarse en la información contextual.

2025-09-02T22:24:45+00:00 ― 6 minilectura

Sonido Avanzando la tecnología de voz con datos de alternancia de código

Un nuevo método mejora el reconocimiento de voz para usuarios que cambian de código.

2025-09-02T21:36:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Aprovechando la detección de sonidos anómalos para mejores resultados

Descubre cómo el análisis de sonido ayuda a identificar problemas en máquinas de manera eficiente.

2025-09-02T20:47:35+00:00 ― 7 minilectura

Computación y lenguaje Avances en la traducción de voz y subtitulado

Este proyecto mejora la traducción de voz en tiempo real y los sistemas de subtitulado automático.

2025-09-02T18:21:50+00:00 ― 5 minilectura

Sonido Nuevas ideas sobre la generalización en redes neuronales

Explorando cómo la agudeza de los mínimos influye en el rendimiento del modelo con datos de audio no vistos.

2025-09-02T15:56:05+00:00 ― 6 minilectura

Sonido Combinando voz y cara para una mejor identificación

Un nuevo método mejora la verificación de hablantes al combinar datos de audio y visuales.

2025-09-02T07:50:15+00:00 ― 6 minilectura

Sonido Transformers en Aprendizaje de Representación Musical

Un estudio sobre el uso de transformadores para un etiquetado y representación musical efectiva.

2025-09-02T07:01:40+00:00 ― 8 minilectura

Multimedia Avances en la localización de altavoces de audio y video

Un nuevo método mejora el seguimiento de hablantes usando datos de audio y visuales.

2025-09-02T06:13:05+00:00 ― 8 minilectura

Sonido Nuevo Método para Analizar la Dificultad de la Música de Piano

Un nuevo enfoque para evaluar la dificultad de la música para piano usando imágenes de partituras.

2025-09-02T05:24:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando las transcripciones de reuniones con el sistema PP-MeT

PP-MeT tiene como objetivo mejorar la precisión en la transcripción de reuniones con varios hablantes.

2025-09-02T04:35:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Un enfoque universal para mejorar el habla

Esta investigación presenta un modelo para mejorar la claridad del habla en diferentes condiciones.

2025-09-02T02:10:10+00:00 ― 6 minilectura

Sonido El auge de los subtítulos automáticos en audio

Explorando los avances en la subtitulación automática de audio y su impacto en la accesibilidad.

2025-09-02T01:21:35+00:00 ― 6 minilectura

Sonido Separación de voz innovadora usando datos de audio y visuales

La investigación presenta un método efectivo para mejorar la claridad del habla en entornos ruidosos.

2025-09-02T00:33:00+00:00 ― 8 minilectura

Aprendizaje automático Avanzando en la coincidencia de estilo de audio con efectos tradicionales

Un nuevo método simplifica la transferencia de estilo de audio utilizando efectos no diferenciables.

2025-09-01T19:41:30+00:00 ― 8 minilectura

Sonido Evaluando la calidad de las interpretaciones de piano generadas por computadora

La investigación examina cómo la música generada por computadora se compara con la interpretación humana a través de pruebas de escucha.

2025-09-01T07:32:45+00:00 ― 9 minilectura

Procesado de Audio y Voz Mejorando el Diseño de Sonido con Polinomios Ultrasféricos

Aprende cómo los polinomios ultrasféricos mejoran la tecnología de audio y la direccionalidad del sonido.

2025-09-01T05:55:35+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando el Reconocimiento de Voz con SSRL

Un nuevo método mejora el reconocimiento de voz usando menos etiquetas y recursos.

2025-09-01T00:15:30+00:00 ― 8 minilectura

Sonido Avances en técnicas de anclaje de texto a audio

Nuevos métodos mejoran la conexión entre descripciones de texto y eventos sonoros.

2025-08-31T16:09:40+00:00 ― 8 minilectura

Procesado de Audio y Voz Detección de dirección del sonido en robots en movimiento

Métodos innovadores mejoran cómo los robots procesan la dirección del sonido mientras se mueven.

2025-08-31T14:32:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la tecnología de formación de haces

Aprende sobre la formación de haces con valores reales y sus beneficios para arreglos de micrófonos.

2025-08-31T12:06:45+00:00 ― 7 minilectura

Sonido Un Nuevo Modelo para la Generación de Música con IA

MusicAOG simplifica la creación y comprensión de la música a través de una representación gráfica innovadora.

2025-08-31T08:52:25+00:00 ― 7 minilectura

Procesado de Audio y Voz Diseñando sistemas MIMO efectivos con arreglos esféricos

Un nuevo marco para combinar micrófonos y altavoces esféricos en estudios de sonido.

2025-08-31T07:15:15+00:00 ― 7 minilectura

Procesado de Audio y Voz Diseñando Sistemas de Audición Efectivos para Robots Humanoides

Un nuevo marco para mejorar la detección de sonido en robots humanoides a través del diseño de arreglos de micrófonos.

2025-08-31T06:26:40+00:00 ― 10 minilectura

Procesado de Audio y Voz Mejorando la acústica de la habitación con sistemas MIMO

Descubre cómo los sistemas MIMO mejoran el análisis de sonido en diferentes entornos.

2025-08-31T02:23:45+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en la investigación de acústica de salas

Nuevas técnicas mejoran la estimación de la dirección del sonido para diferentes configuraciones de audio.

2025-08-31T01:35:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Controlando el sonido para experiencias de escucha más claras

La investigación revela métodos para ajustar el comportamiento del sonido en las habitaciones y mejorar la claridad.

2025-08-31T00:46:35+00:00 ― 5 minilectura

Visión por Computador y Reconocimiento de Patrones Detectando Humor en Videos con FunnyNet-W

Un nuevo modelo identifica momentos graciosos en videos usando datos visuales, de audio y de texto.

2025-08-30T23:09:25+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en elastómeros dieléctricos para tecnología

Los elastómeros dieléctricos convierten la energía eléctrica en movimiento mecánico, ofreciendo diversas aplicaciones.

2025-08-30T20:43:40+00:00 ― 9 minilectura

Computación y lenguaje Usando tecnología ASR para ayudar en el diagnóstico de demencia

Las transcripciones de ASR con errores pueden ayudar a identificar el Alzheimer de manera más precisa.

2025-08-30T16:40:45+00:00 ― 10 minilectura

Computación y lenguaje Presentamos ELLA-V: Un Nuevo Capítulo en la Síntesis de Voz

ELLA-V mejora la calidad y el control del texto a voz, superando modelos anteriores.

2025-08-30T01:17:40+00:00 ― 6 minilectura

Métodos cuantitativos Nuevo método mejora el monitoreo acústico de la vida salvaje

Un nuevo enfoque mejora la precisión en la detección de llamadas de animales sin usar umbrales arbitrarios.

2025-08-29T23:46:39+00:00 ― 8 minilectura

Computación y lenguaje Avanzando en la clasificación de voz con datos multimodales

Un nuevo modelo integra audio y texto para mejorar la clasificación del habla.

2025-08-29T18:49:00+00:00 ― 8 minilectura

Sonido Reto NOTSOFAR-1: Mejorando la Tecnología de Transcripción de Reuniones

Una nueva iniciativa para mejorar la tecnología de transcripción para reuniones en salas grandes.

2025-08-29T16:23:15+00:00 ― 9 minilectura

Computación y lenguaje Avances en la Corrección de Errores de Reconocimiento de Voz

Nuevos métodos mejoran la precisión en el reconocimiento de voz ruidosa usando modelos de lenguaje grandes.

2025-08-29T01:48:45+00:00 ― 7 minilectura

Sonido Entendiendo las vocalizaciones de las gallinas ponedoras para una mejor granja

Analizar los sonidos de las gallinas ayuda a mejorar su salud y la productividad de la granja.

2025-08-29T00:11:35+00:00 ― 9 minilectura

Interacción Persona-Ordenador Desenredando el Sonido: Una Nueva Herramienta para la Realidad Mixta

Un método para ayudar a las personas con discapacidad visual a reconocer sonidos en realidad mixta.

2025-08-28T20:57:15+00:00 ― 6 minilectura

Procesado de Audio y Voz Abordando los desafíos de la tecnología del habla para idiomas con pocos recursos

Este artículo habla sobre soluciones para aplicaciones de voz en idiomas con datos transcritos limitados.

2025-08-28T18:31:30+00:00 ― 7 minilectura

Informática - Sonido