O CompAgent melhora a criação de imagens a partir de texto quebrando prompts complexos.
― 8 min ler
Ciência de ponta explicada de forma simples
O CompAgent melhora a criação de imagens a partir de texto quebrando prompts complexos.
― 8 min ler
Um novo método melhora animações de cenas 3D a partir de comandos de texto.
― 7 min ler
ReGround3D melhora a compreensão das instruções humanas em ambientes 3D.
― 5 min ler
GenArtist melhora a geração e edição de imagens com um agente de IA inteligente.
― 7 min ler
Um novo benchmark aborda a necessidade de uma avaliação padrão na previsão espaço-temporal.
― 9 min ler
OVExp combina linguagem e visão pra navegação de objetos em ambientes variados.
― 6 min ler
LLaVA-3D combina insights 2D e 3D pra um raciocínio espacial mais profundo.
― 6 min ler
SAMPart3D simplifica a análise e edição de modelos 3D com técnicas de segmentação inovadoras.
― 5 min ler
Novo método transforma imagens planas em cenas 3D vibrantes.
― 7 min ler
A Moto usa análise de vídeo pra ensinar robôs a fazer movimentos complexos de forma eficiente.
― 6 min ler
Descubra como o V2PE melhora os Modelos de Visão-Linguagem pra entender melhor contextos longos.
― 6 min ler
Descubra como a geração paralelizada transforma a produção de imagens e vídeos.
― 6 min ler