O CLIP manda bem em lidar com desequilíbrio de dados em tarefas visuais e de linguagem.
― 8 min ler
Ciência de ponta explicada de forma simples
O CLIP manda bem em lidar com desequilíbrio de dados em tarefas visuais e de linguagem.
― 8 min ler
MMScan melhora a capacidade da IA de entender ambientes 3D complexos com anotações extensas.
― 8 min ler
Um novo método ajuda robôs a carregar objetos juntos.
― 7 min ler
OVExp combina linguagem e visão pra navegação de objetos em ambientes variados.
― 6 min ler
LLaVA-3D combina insights 2D e 3D pra um raciocínio espacial mais profundo.
― 6 min ler
Um novo modelo ajuda os robôs a misturar visão com ação pra melhorar suas habilidades de manipulação.
― 6 min ler