Xihui Liu

O CompAgent melhora a criação de imagens a partir de texto quebrando prompts complexos.

2025-09-13T21:42:42+00:00 ― 8 min ler

Um novo método melhora animações de cenas 3D a partir de comandos de texto.

2025-08-25T14:06:48+00:00 ― 7 min ler

ReGround3D melhora a compreensão das instruções humanas em ambientes 3D.

2025-07-21T19:05:00+00:00 ― 5 min ler

GenArtist melhora a geração e edição de imagens com um agente de IA inteligente.

2025-07-17T00:39:54+00:00 ― 7 min ler

Um novo benchmark aborda a necessidade de uma avaliação padrão na previsão espaço-temporal.

2025-07-15T01:47:30+00:00 ― 9 min ler

OVExp combina linguagem e visão pra navegação de objetos em ambientes variados.

2025-07-14T06:34:06+00:00 ― 6 min ler

LLaVA-3D combina insights 2D e 3D pra um raciocínio espacial mais profundo.

2025-06-05T06:01:24+00:00 ― 6 min ler

SAMPart3D simplifica a análise e edição de modelos 3D com técnicas de segmentação inovadoras.

2025-05-25T20:45:36+00:00 ― 5 min ler

Novo método transforma imagens planas em cenas 3D vibrantes.

2025-04-17T06:42:45+00:00 ― 7 min ler

A Moto usa análise de vídeo pra ensinar robôs a fazer movimentos complexos de forma eficiente.

2025-04-12T02:19:30+00:00 ― 6 min ler

Descubra como o V2PE melhora os Modelos de Visão-Linguagem pra entender melhor contextos longos.

2025-03-17T05:59:33+00:00 ― 6 min ler

Descubra como a geração paralelizada transforma a produção de imagens e vídeos.

2025-02-13T07:36:18+00:00 ― 6 min ler