Ingeniería Eléctrica y Ciencia de Sistemas - Procesado de Audio y Voz

RSS

Sonido Predicciones Mejoradas del Control de Tráfico Aéreo con el Marco SIA-FTP

Un nuevo marco mejora las predicciones de trayectoria de vuelo usando instrucciones habladas en tiempo real.

2025-11-14T10:30:20+00:00 ― 5 minilectura

Últimos artículos

Sonido Mejorando la subtitulación de audio con un nuevo método de pérdida

2025-11-14T09:41:45+00:00 ― 5 minilectura

Sonido LORIS: Un Nuevo Enfoque para la Generación de Música de Video

2025-11-14T05:38:50+00:00 ― 6 minilectura

Computación y lenguaje Las redes neuronales aprenden sintaxis a partir del sonido

2025-11-14T02:24:30+00:00 ― 8 minilectura

Procesado de Audio y Voz PLiX: Un Nuevo Enfoque para el Reconocimiento de Voz

2025-11-13T23:10:10+00:00 ― 9 minilectura

Sonido Avances en la detección de eventos sonoros usando aprendizaje con pocos ejemplos

2025-11-13T20:44:25+00:00 ― 7 minilectura

Últimos artículos

Computación y lenguaje Impacto de la calidad de audio en la investigación sobre el aprendizaje de lenguas

Un estudio revela cómo la claridad del audio afecta el análisis de la adquisición del lenguaje en bebés.

2025-11-13T14:15:45+00:00 ― 6 minilectura

Procesado de Audio y Voz Nueva herramienta de simulación acústica para posicionamiento en interiores

Una herramienta mejora los sistemas de posicionamiento interior basados en sonido a través de una simulación eficiente.

2025-11-13T10:12:50+00:00 ― 6 minilectura

Computación y lenguaje Avances en sistemas de comprensión del lenguaje hablado

Un nuevo enfoque mejora la comprensión del lenguaje hablado usando procesamiento de audio eficiente.

2025-11-13T02:07:00+00:00 ― 8 minilectura

Sonido Mejorando la eficiencia de CNN mediante la poda de filtros

Este artículo presenta un método para mejorar las CNN eliminando filtros innecesarios.

2025-11-12T15:35:25+00:00 ― 5 minilectura

Procesado de Audio y Voz Equilibrando la Velocidad y la Precisión en el Reconocimiento de Voz

Un nuevo enfoque mejora el reconocimiento de voz en tiempo real al equilibrar velocidad y precisión.

2025-11-12T13:09:40+00:00 ― 8 minilectura

Computación y lenguaje Presentamos X-LLM: Un Nuevo Modelo de Lenguaje Multimodal

X-LLM integra imágenes, videos y speech en el procesamiento del lenguaje.

2025-11-12T11:32:30+00:00 ― 6 minilectura

Computación y lenguaje Avances en el Reconocimiento de Emociones en el Habla

Un nuevo método mejora la detección de emociones en el habla usando técnicas de autoatención.

2025-11-12T06:41:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Conformador Rápido: Mejorando el Reconocimiento de Voz

Fast Conformer mejora la velocidad y precisión del reconocimiento de voz para varias aplicaciones.

2025-11-11T20:09:25+00:00 ― 5 minilectura

Computación y lenguaje Uniendo el procesamiento de voz y el procesamiento de lenguaje natural

Uniendo el lenguaje hablado y escrito para mejores modelos de comunicación.

2025-11-11T16:06:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la tecnología de conversión de voz a canto

La investigación presenta un método para convertir palabras habladas en canto de manera eficiente.

2025-11-11T12:52:10+00:00 ― 9 minilectura

Procesado de Audio y Voz Tecnología de voz y riesgos de privacidad

Examinando el impacto de la tecnología de voz en la privacidad personal.

2025-11-11T11:15:00+00:00 ― 5 minilectura

Procesado de Audio y Voz QVoice: Tu compañero en la pronunciación del árabe

Una app móvil diseñada para mejorar la pronunciación en árabe para todos los que aprenden.

2025-11-11T08:49:15+00:00 ― 6 minilectura

Sonido Arreglando huecos en el audio de voz con aprendizaje automático

Este artículo habla de cómo el aprendizaje automático llena los vacíos en el audio del habla.

2025-11-11T07:12:05+00:00 ― 6 minilectura

Procesado de Audio y Voz Nuevo método para la localización de fuentes de sonido usando tres micrófonos

Este método ayuda a las personas con pérdida auditiva a identificar fuentes de sonido en su entorno.

2025-11-11T05:34:55+00:00 ― 7 minilectura

Sonido Avances en la tecnología de mejora del sonido

Explora las últimas técnicas que mejoran la claridad del habla en ambientes ruidosos.

2025-11-11T04:46:20+00:00 ― 6 minilectura

Sonido Avances en la separación de audio con AudioSlots

AudioSlots mejora la claridad del sonido al separar las grabaciones de audio mezcladas de manera efectiva.

2025-11-11T03:57:45+00:00 ― 5 minilectura

Sonido Creando Cantantes Digitales: Un Nuevo Enfoque

Un método para crear voces cantando sin necesidad de etiquetar las voces en detalle.

2025-11-11T00:43:25+00:00 ― 8 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz para palabras raras

Un método mejora cómo los asistentes de voz reconocen palabras poco comunes usando el contexto.

2025-11-10T23:54:50+00:00 ― 7 minilectura

Sonido Revolucionando las técnicas de doblaje automático

Un nuevo marco mejora el doblaje al capturar estilos de habla en diferentes idiomas.

2025-11-10T23:06:15+00:00 ― 9 minilectura

Sonido Nuevo Método para Analizar el Jitter de Audio

Un enfoque nuevo para medir el jitter usando el análisis de cruce por cero en equipos de audio.

2025-11-10T18:27:30+00:00 ― 8 minilectura

Sonido Avances en técnicas de separación de fuentes universales

Un nuevo marco utiliza datos débilmente etiquetados para una separación de audio efectiva.

2025-11-10T11:46:05+00:00 ― 8 minilectura

Sonido Avances en la Síntesis de Voz con CoMoSpeech

CoMoSpeech mejora la velocidad y calidad de la síntesis de voz con un proceso de un solo paso.

2025-11-10T05:17:25+00:00 ― 5 minilectura

Sonido Avances en técnicas de separación de música

Nuevos estándares mejoran los modelos de separación de audio para música y entretenimiento.

2025-11-10T02:03:05+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en la tecnología de reconocimiento automático de voz

Nuevo método mejora modelos de reconocimiento de voz y reduce la pérdida de conocimiento.

2025-11-09T22:48:45+00:00 ― 5 minilectura

Computación y lenguaje Desafíos y Soluciones en el Reconocimiento Automático de Voz

Explorando el rendimiento de ASR en diferentes acentos y sus implicaciones.

2025-11-09T16:20:05+00:00 ― 7 minilectura

Sonido Enfoques Innovadores para Reorganizar Música

Un nuevo método para crear versiones musicales únicas rearranjando piezas existentes.

2025-11-09T15:31:30+00:00 ― 7 minilectura

Sonido Avances en la síntesis de voz con TorToise

Un nuevo sistema mejora la generación de voz con salidas de alta calidad.

2025-11-09T14:42:55+00:00 ― 8 minilectura

Procesado de Audio y Voz Avanzando el Reconocimiento de Voz a Través de Perspectivas Emocionales

Un nuevo modelo mejora la precisión del reconocimiento de voz durante el habla emocional.

2025-11-09T09:02:50+00:00 ― 6 minilectura

Sonido Técnicas Simplificadas de Síntesis de FM y PM

Aprende a usar FM y PM de manera efectiva en el diseño de sonido.

2025-11-09T08:14:15+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la reducción de ruido en audífonos

Descubre nuevos métodos para mejorar el rendimiento de los audífonos y la claridad del habla.

2025-11-09T06:37:05+00:00 ― 6 minilectura

Sonido Nuevo enfoque auto-supervisado para el reconocimiento de voz

Un nuevo método mejora las tareas de reconocimiento de voz usando menos datos etiquetados.

2025-11-09T00:08:25+00:00 ― 6 minilectura

Sonido Avances en Técnicas de Subtitulación de Audio

Este artículo analiza las mejoras recientes en la creación de descripciones de audio escritas.

2025-11-08T21:42:40+00:00 ― 6 minilectura

Sonido Nuevo sistema de huellas de audio para TVs

Tecnología de reconocimiento de audio eficiente diseñada para dispositivos de televisión de bajo consumo.

2025-11-08T13:36:50+00:00 ― 5 minilectura

Sonido Presentamos SCHmUBERT: Un Nuevo Modelo para la Generación de Música

SCHmUBERT ofrece un enfoque nuevo para crear música simbólica con IA.

2025-11-08T12:48:15+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Abordando la invasión de Pomacea canaliculata

Usando IA para identificar huevos de caracol rosa invasor y mejorar su manejo.

2025-11-08T11:11:05+00:00 ― 6 minilectura

Sonido Avances en la estimación de confianza para el reconocimiento de voz

Un nuevo modelo mejora las puntuaciones de confianza en los sistemas de reconocimiento de voz.

2025-11-08T02:16:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en el Reconocimiento del Habla Disártrica

Nuevas técnicas mejoran la comprensión del habla disártica en los sistemas de comunicación.

2025-11-08T01:28:05+00:00 ― 6 minilectura

Sonido Avances en técnicas de separación de voz

Un nuevo enfoque no supervisado mejora la isolación de voces en mezclas de audio.

2025-11-07T23:50:55+00:00 ― 5 minilectura

Sonido ML-SUPERB: Evaluando Modelos de Voz Multilingües

Un nuevo estándar para evaluar modelos de aprendizaje automático en la comprensión del habla entre idiomas.

2025-11-07T23:02:20+00:00 ― 7 minilectura

Computación y lenguaje Mejorando la clasificación de fonemas en el reconocimiento de voz

Este artículo habla sobre métodos para mejorar la clasificación de teléfonos usando características de audio.

2025-11-07T21:25:10+00:00 ― 8 minilectura