Shanghang Zhang

SPHINX-V mejora la capacidad de la IA para interpretar imágenes a través de la interacción del usuario.

2025-08-24T07:49:48+00:00 ― 7 minilectura

Un nuevo marco mejora la comprensión de la IA sobre los espacios 3D.

2025-08-11T19:14:05+00:00 ― 8 minilectura

Un nuevo método para crear imágenes 3D detalladas a partir de imágenes simples usando difusión multivista.

2025-08-10T01:29:48+00:00 ― 6 minilectura

CoCoGesture crea gestos realistas que coinciden con las palabras habladas, mejorando la interacción.

2025-08-06T05:04:00+00:00 ― 6 minilectura

Un nuevo modelo mejora la conexión entre la comprensión visual y del lenguaje.

2025-07-25T11:10:06+00:00 ― 6 minilectura

MMTrail combina descripciones visuales y de audio para mejorar los modelos de video-lenguaje.

2025-07-08T06:53:20+00:00 ― 5 minilectura

FactorLLM mejora la eficiencia en modelos de lenguaje al reorganizar el almacenamiento de conocimiento.

2025-06-27T17:27:42+00:00 ― 6 minilectura

Un nuevo método mejora el detalle en la creación de imágenes usando indicaciones regionales.

2025-05-31T15:49:06+00:00 ― 7 minilectura

Un nuevo enfoque mejora el aprendizaje del modelo a partir de datos de imagen variados.

2025-05-26T18:30:36+00:00 ― 8 minilectura

Una nueva técnica mejora la claridad de las imágenes en entornos urbanos concurridos.

2025-05-11T11:06:40+00:00 ― 8 minilectura

Descubre cómo ASGDiffusion transforma la generación de imágenes en alta resolución.

2025-04-02T23:14:33+00:00 ― 8 minilectura