Hongxu Yin

Novo método resolve problemas de superexposição em gravações de vídeo do dia a dia usando deep learning.

2025-10-03T02:32:42+00:00 ― 8 min ler

Uma nova abordagem para ajustar modelos melhora a eficiência e a precisão nas tarefas de machine learning.

2025-09-08T00:10:12+00:00 ― 8 min ler

Uma olhada detalhada nas capacidades do RegionGPT em analisar regiões de imagens.

2025-09-01T19:23:12+00:00 ― 9 min ler

O SpatialRGPT melhora a compreensão do arranjo de objetos em Modelos de Linguagem Visual.

2025-08-03T05:10:36+00:00 ― 8 min ler

Novos modelos adaptáveis podem atender a diversas necessidades sem precisar de retraining.

2025-07-31T06:44:06+00:00 ― 9 min ler

Um novo método melhora a qualidade dos dados para modelos de linguagem visual usando técnicas de aumento.

2025-07-07T17:53:06+00:00 ― 8 min ler

VILA-U integra tarefas de vídeo, imagem e linguagem em uma única estrutura.

2025-06-16T03:07:06+00:00 ― 7 min ler

Um novo método melhora o desempenho dos LLMs enquanto reduz a complexidade.

2025-06-06T07:41:54+00:00 ― 8 min ler

NaVILA ajuda robôs a navegar usando linguagem e visão.

2025-04-12T05:32:06+00:00 ― 7 min ler