Ludwig Schmidt

Objaverse-XL oferece mais de 10 milhões de objetos 3D diversos para o desenvolvimento de tecnologia avançada.

2025-10-21T11:21:54+00:00 ― 7 min ler

Legendas melhores podem melhorar o desempenho de modelos multimodais usando imagens da web.

2025-10-18T05:01:24+00:00 ― 7 min ler

Este estudo analisa como os dados de pré-treinamento afetam a robustez do modelo em várias tarefas.

2025-10-16T07:28:00+00:00 ― 8 min ler

OpenFlamingo oferece uma plataforma versátil para treinar modelos que conectam imagens e texto.

2025-10-13T05:28:12+00:00 ― 5 min ler

Descubra como as redes de filtragem de dados afetam conjuntos de dados de machine learning e o desempenho dos modelos.

2025-09-20T06:42:30+00:00 ― 8 min ler

Essa pesquisa foca em otimizar o treinamento de modelos de linguagem e prever o desempenho deles no mundo real.

2025-08-29T16:12:18+00:00 ― 5 min ler

Esse estudo foca em melhorar a precisão espacial na geração de imagens a partir de texto.

2025-08-23T15:53:54+00:00 ― 7 min ler

Um estudo destaca a dependência do CLIP em características espúrias no reconhecimento de imagens.

2025-08-19T07:53:04+00:00 ― 5 min ler

Incluir dados em outras línguas melhora o desempenho do modelo de visão-linguagem e a compreensão cultural.

2025-08-06T05:35:36+00:00 ― 7 min ler

Os VLMs têm dificuldade com classificação de imagens, mas uma melhor integração de dados pode melhorar suas capacidades.

2025-08-05T22:05:18+00:00 ― 4 min ler

Usar modelos de linguagem melhora as previsões para dados tabulares em várias áreas.

2025-07-27T22:01:24+00:00 ― 7 min ler

MINT-1T é o maior conjunto de dados open-source pra treinar modelos multimodais.

2025-07-27T13:20:00+00:00 ― 6 min ler

Um guia para melhorar o treinamento de modelos de linguagem com recursos limitados.

2025-07-23T08:44:24+00:00 ― 9 min ler

Um novo método melhora a qualidade dos dados sintéticos pra alinhar melhor os modelos de linguagem.

2025-06-30T13:24:06+00:00 ― 6 min ler

xGen-MM melhora modelos multimodais pra um aprendizado melhor de imagens e textos.

2025-06-27T00:04:54+00:00 ― 7 min ler

O KALE combina imagens com legendas ricas pra facilitar o entendimento.

2025-05-26T04:48:27+00:00 ― 6 min ler