AVIBench prueba a los LVLMs para asegurarse de que aguanten instrucciones visuales adversariales.
― 9 minilectura
Ciencia de vanguardia explicada de forma sencilla
AVIBench prueba a los LVLMs para asegurarse de que aguanten instrucciones visuales adversariales.
― 9 minilectura
Un nuevo modelo mejora la comprensión de videos a través de técnicas de entrenamiento innovadoras.
― 7 minilectura
Los investigadores crean un conjunto de datos para estudiar cómo la gente aprende imitando a otros.
― 9 minilectura
DIBS mejora la subtitulación de eventos en video refinando los límites usando datos no etiquetados.
― 9 minilectura
Transforma texto en imágenes, videos y audio sin problemas con Lumina-T2X.
― 7 minilectura
Un nuevo enfoque mejora los coches autónomos al imitar los patrones de pensamiento humano.
― 10 minilectura
Este artículo detalla un enfoque innovador para mejorar los modelos de lenguaje utilizando modelos más pequeños.
― 9 minilectura
Un nuevo conjunto de datos y modelo mejoran la calidad de los subtítulos de video para máquinas.
― 6 minilectura
Un conjunto de herramientas para evaluar la seguridad de modelos de lenguaje avanzados.
― 6 minilectura
Nuevo enfoque mejora el aprendizaje a partir de datos intercalados de imagen y texto.
― 8 minilectura
Un conjunto de datos completo que combina imágenes y texto para ayudar al aprendizaje automático.
― 8 minilectura
Un enfoque estructurado para evaluar modelos de texto a video con mayor eficiencia.
― 14 minilectura
Un nuevo marco ayuda a los modelos de lenguaje a aprender lenguaje simbólico sin la ayuda de humanos.
― 8 minilectura
Un nuevo conjunto de datos mejora la capacidad de la IA para procesar documentos científicos de manera efectiva.
― 6 minilectura
Los investigadores mejoran las habilidades de traducción para más de 100 idiomas, centrándose en idiomas con pocos recursos.
― 8 minilectura
Este método simplifica agregar objetos a imágenes con textos, asegurando resultados naturales.
― 6 minilectura
Un nuevo modelo revoluciona la generación de imágenes a partir de descripciones de texto, mejorando varias industrias.
― 6 minilectura
GigaGS aborda los desafíos en la modelación de escenas 3D grandes con técnicas innovadoras.
― 6 minilectura
Un método que mejora la alineación del modelo de lenguaje con las preferencias humanas.
― 6 minilectura
Un nuevo método mejora las habilidades de razonamiento en modelos de lenguaje usando optimización de preferencias.
― 5 minilectura
SyncVIS mejora el seguimiento y la segmentación de objetos en videos para varias aplicaciones.
― 6 minilectura
Nuevo método mejora el rendimiento de tareas visuales en modelos de lenguaje multimodal.
― 8 minilectura
Vinci hace que las tareas diarias sean más fáciles con ayuda manos libres y orientación en tiempo real.
― 8 minilectura