Wei Xue

Computación y lenguaje Presentamos LyricWhiz: Transformando la transcripción de letras

LyricWhiz combina modelos avanzados para mejorar la precisión de la transcripción de letras en diferentes idiomas.

2025-10-15T09:51:10+00:00 ― 7 minilectura

Computación y lenguaje Avances en Aprendizaje Continuo para Sistemas de Diálogo

Nuevos métodos mejoran el aprendizaje de tareas y la retención en sistemas de diálogo.

2025-09-27T04:44:24+00:00 ― 7 minilectura

Sonido MuPT: Avanzando en la Generación de Música con Notación ABC

MuPT utiliza la notación ABC para generar música de manera efectiva con IA.

2025-08-12T09:00:00+00:00 ― 7 minilectura

Procesado de Audio y Voz FlashSpeech: Un Salto en la Sintetización de Voz

FlashSpeech ofrece soluciones de síntesis de voz rápidas y de alta calidad.

2025-08-10T03:33:30+00:00 ― 8 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en la Generación de Gestos con CoCoGesture

CoCoGesture crea gestos realistas que coinciden con las palabras habladas, mejorando la interacción.

2025-08-06T05:04:00+00:00 ― 6 minilectura

Inteligencia artificial El futuro de la generación multimodal con LLMs

Explora cómo los modelos de lenguaje grandes mejoran la creatividad a través de la generación multimedia.

2025-08-04T21:12:12+00:00 ― 9 minilectura

Visión por Computador y Reconocimiento de Patrones Generación de música innovadora para videos

Un nuevo método para crear música que se ajuste de manera efectiva al contenido de video.

2025-08-01T13:48:30+00:00 ― 9 minilectura

Física de altas energías - Fenomenología Producción de Partículas Durante la Inflación: Un Vistazo Más Cercano

Este estudio explora cómo se forman las partículas durante la fase de inflación del universo.

2025-07-29T08:20:45+00:00 ― 9 minilectura

Aprendizaje automático Avances en la Asimilación de Datos con VAE-Var

Un nuevo algoritmo mejora las predicciones al modelar los errores de fondo de manera más precisa.

2025-07-29T00:29:45+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones MMTrail: Un conjunto de datos de video completo para modelos de lenguaje

MMTrail combina descripciones visuales y de audio para mejorar los modelos de video-lenguaje.

2025-07-08T06:53:20+00:00 ― 5 minilectura

Sonido Evaluando Modelos de Lenguaje Grandes en la Creación Musical

Este estudio analiza qué tan bien entienden y generan música los LLMs.

2025-07-07T10:38:45+00:00 ― 6 minilectura

Aprendizaje automático Mejorando la Eficiencia en Modelos de Lenguaje

Un nuevo método mejora los modelos de lenguaje para un mejor rendimiento y menor uso de recursos.

2025-07-02T19:46:48+00:00 ― 6 minilectura

Aprendizaje automático NoRA: Un Nuevo Enfoque para Ajustar Modelos Grandes

NoRA ofrece una forma más inteligente de adaptar modelos grandes con menos recursos.

2025-06-26T11:10:42+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en tecnología de audio: Presentando X-Codec

X-Codec mejora la generación de audio al integrar comprensión semántica en el procesamiento.

2025-06-21T15:41:45+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avanzando el modelado 3D a partir de imágenes únicas

Un nuevo método ofrece un modelado 3D mejorado a partir de solo una imagen, aumentando el realismo.

2025-06-11T04:13:24+00:00 ― 8 minilectura

Sonido Extracción de hablantes objetivo: Mejorando la claridad en entornos ruidosos

Descubre cómo TSE mejora el reconocimiento de voz en entornos ruidosos usando señales de texto.

2025-05-25T00:14:51+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Generación de Videos de Canto Revolucionarios

Investigadores desarrollan un nuevo modelo para videos de canto animado, mejorando las animaciones.

2025-04-16T10:39:00+00:00 ― 7 minilectura

Física de altas energías - Fenomenología Axiones y Cuerdas Cósmicas: Una Conexión con la Materia Oscura

Explorando la conexión entre axiones, cuerdas cósmicas y los misterios de la materia oscura.

2025-02-28T14:15:54+00:00 ― 6 minilectura