Un estudio sobre la capacidad de los VLMs para identificar tiempo y lugar a partir de imágenes.
― 11 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un estudio sobre la capacidad de los VLMs para identificar tiempo y lugar a partir de imágenes.
― 11 minilectura
Un nuevo modelo mejora la precisión de recuperación de videos con múltiples eventos.
― 7 minilectura
Este artículo habla de un nuevo estándar para combinar imágenes y texto para encontrar eventos en videos.
― 10 minilectura
Este artículo habla sobre problemas de seguridad en los modelos de texto a imagen y propone soluciones.
― 8 minilectura