Shanghang Zhang

Um novo método melhora a adaptabilidade da detecção de objetos a dados diversos.

2025-10-24T21:23:36+00:00 ― 6 min ler

Um novo método melhora a modelagem 3D para objetos específicos usando técnicas neurais avançadas.

2025-09-23T05:48:30+00:00 ― 7 min ler

Um novo método melhora como os modelos percebem profundidade e relações espaciais em imagens.

2025-09-12T21:44:54+00:00 ― 7 min ler

O SPHINX-V melhora a capacidade da IA de interpretar imagens através da interação do usuário.

2025-08-24T07:49:48+00:00 ― 7 min ler

Uma nova estrutura melhora a compreensão da IA em espaços 3D.

2025-08-11T19:14:05+00:00 ― 8 min ler

Um método novo pra criar imagens 3D detalhadas a partir de imagens únicas usando difusão multivista.

2025-08-10T01:29:48+00:00 ― 5 min ler

CoCoGesture cria gestos realistas que combinam com as palavras faladas, melhorando a interação.

2025-08-06T05:04:00+00:00 ― 6 min ler

Um novo modelo melhora a conexão entre compreensão visual e de linguagem.

2025-07-25T11:10:06+00:00 ― 6 min ler

O MMTrail combina descrições visuais e sonoras para melhorar os modelos de linguagem em vídeo.

2025-07-08T06:53:20+00:00 ― 5 min ler

O FactorLLM melhora a eficiência em modelos de linguagem reorganizando o armazenamento de conhecimento.

2025-06-27T17:27:42+00:00 ― 6 min ler

Um novo método melhora os detalhes na criação de imagens usando prompts regionais.

2025-05-31T15:49:06+00:00 ― 7 min ler

Uma nova abordagem melhora o aprendizado do modelo a partir de dados de imagem variados.

2025-05-26T18:30:36+00:00 ― 7 min ler

Uma nova técnica melhora a clareza das imagens em ambientes urbanos movimentados.

2025-05-11T11:06:40+00:00 ― 7 min ler

Descubra como o ASGDiffusion muda a geração de imagens em alta resolução.

2025-04-02T23:14:33+00:00 ― 7 min ler