Michael Tschannen

Uma nova estrutura melhora o raciocínio visual usando modelos de linguagem como controladores.

2025-09-19T03:35:06+00:00 ― 6 min ler

Uma nova abordagem melhora a legendagem de imagens com técnicas que levam em conta a localização.

2025-08-24T17:34:24+00:00 ― 7 min ler

A PaliGemma combina entendimento de imagem e texto pra aplicações versáteis.

2025-07-15T20:45:06+00:00 ― 7 min ler

O JetFormer cria imagens e textos juntos de um jeito eficiente.

2025-05-01T00:18:40+00:00 ― 6 min ler

VLMs misturam visão e linguagem, criando máquinas mais espertas que entendem o mundo melhor.

2025-04-17T05:06:27+00:00 ― 7 min ler

Descubra como o Jet transforma barulho em imagens incríveis sem esforço.

2025-02-13T10:00:45+00:00 ― 9 min ler