Hongxu Yin

Un modo nuovo di affinare i modelli migliora l'efficienza e la precisione nei compiti di machine learning.

2025-09-08T00:10:12+00:00 ― 7 leggere min

Uno sguardo dettagliato sulle capacità di RegionGPT nell'analizzare le regioni delle immagini.

2025-09-01T19:23:12+00:00 ― 8 leggere min

SpatialRGPT migliora la comprensione della disposizione degli oggetti nei modelli di linguaggio visivo.

2025-08-03T05:10:36+00:00 ― 7 leggere min

Nuovi modelli adattabili possono soddisfare esigenze diverse senza riqualificazione.

2025-07-31T06:44:06+00:00 ― 8 leggere min

Un nuovo metodo migliora la qualità dei dati per i modelli di linguaggio visivo usando tecniche di aumento.

2025-07-07T17:53:06+00:00 ― 7 leggere min

VILA-U integra video, immagini e compiti di lingua in un'unica struttura.

2025-06-16T03:07:06+00:00 ― 6 leggere min

Un nuovo metodo migliora le prestazioni degli LLM riducendo la complessità.

2025-06-06T07:41:54+00:00 ― 7 leggere min

NaVILA aiuta i robot a navigare usando il linguaggio e la visione.

2025-04-12T05:32:06+00:00 ― 6 leggere min