Boqing Gong

Nuevo método mejora la localización de objetos usando relaciones entre el lenguaje y las imágenes.

2025-09-22T15:03:42+00:00 ― 7 minilectura

Nuevos métodos mejoran la capacidad de las máquinas para crear imágenes a partir de indicaciones de texto.

2025-09-19T03:27:12+00:00 ― 6 minilectura

Un nuevo método mejora la subtitulación de videos usando modelos de imagen-lenguaje.

2025-09-17T18:48:00+00:00 ― 8 minilectura

VideoPrism ayuda a interpretar y analizar contenido de video de manera efectiva.

2025-09-05T19:53:54+00:00 ― 6 minilectura

La investigación revela cómo los parches de activación influyen en la generación de imágenes en modelos de difusión.

2025-08-02T07:35:00+00:00 ― 8 minilectura

Un nuevo enfoque para mejorar los prompts de modelos de texto a imagen para obtener mejores resultados.

2025-07-09T19:45:24+00:00 ― 6 minilectura

SOAR mejora la precisión del reconocimiento de acciones en el análisis de videos de drones.

2025-06-05T08:39:24+00:00 ― 6 minilectura

Presentamos los Autoencoders Máscarados de Video Largo para una mejor comprensión del video.

2025-05-16T19:28:00+00:00 ― 7 minilectura

HypDAE transforma la manera en que creamos imágenes a partir de ejemplos mínimos.

2025-05-07T03:40:00+00:00 ― 7 minilectura

El conjunto de datos DAVE captura escenarios de carretera complejos para un mejor entrenamiento de IA.

2025-01-20T21:51:18+00:00 ― 9 minilectura