CLIP muestra que es fuerte para manejar el desbalance de datos en tareas visuales y de lenguaje.
― 8 minilectura
Ciencia de vanguardia explicada de forma sencilla
CLIP muestra que es fuerte para manejar el desbalance de datos en tareas visuales y de lenguaje.
― 8 minilectura
MMScan mejora la capacidad de la IA para entender entornos 3D complejos con anotaciones extensas.
― 8 minilectura
Un nuevo método ayuda a los robots a cargar objetos juntos.
― 7 minilectura
OVExp combina lenguaje y visión para una navegación efectiva de objetos en diferentes entornos.
― 6 minilectura
LLaVA-3D combina información 2D y 3D para un razonamiento espacial más profundo.
― 6 minilectura
Un nuevo modelo ayuda a los robots a combinar la visión con la acción para mejorar sus habilidades de manipulación.
― 6 minilectura