Shanghang Zhang

Un nuovo metodo migliora l'adattabilità del riconoscimento degli oggetti a dati diversi.

2025-10-24T21:23:36+00:00 ― 6 leggere min

Un nuovo metodo migliora la modellazione 3D per oggetti specifici usando tecniche neurali avanzate.

2025-09-23T05:48:30+00:00 ― 6 leggere min

Un nuovo metodo migliora come i modelli percepiscono la profondità e le relazioni spaziali nelle immagini.

2025-09-12T21:44:54+00:00 ― 6 leggere min

SPHINX-V migliora la capacità dell'IA di interpretare le immagini tramite l'interazione dell'utente.

2025-08-24T07:49:48+00:00 ― 6 leggere min

Un nuovo framework migliora la comprensione dell'IA degli spazi 3D.

2025-08-11T19:14:05+00:00 ― 7 leggere min

Un nuovo metodo per creare immagini 3D dettagliate da un'unica immagine usando la diffusione multiview.

2025-08-10T01:29:48+00:00 ― 5 leggere min

CoCoGesture crea gesti realistici che si abbinano alle parole pronunciate, migliorando l'interazione.

2025-08-06T05:04:00+00:00 ― 5 leggere min

Un nuovo modello migliora il legame tra comprensione visiva e linguistica.

2025-07-25T11:10:06+00:00 ― 5 leggere min

MMTrail combina descrizioni visive e audio per modelli video-linguistici migliori.

2025-07-08T06:53:20+00:00 ― 5 leggere min

FactorLLM migliora l'efficienza nei modelli di lingua riorganizzando lo stoccaggio delle conoscenze.

2025-06-27T17:27:42+00:00 ― 5 leggere min

Un nuovo metodo migliora i dettagli nella creazione di immagini usando suggerimenti regionali.

2025-05-31T15:49:06+00:00 ― 6 leggere min

Un nuovo approccio migliora l'apprendimento del modello da dati di immagini vari.

2025-05-26T18:30:36+00:00 ― 7 leggere min

Una nuova tecnica migliora la chiarezza delle immagini in ambienti di strada affollati.

2025-05-11T11:06:40+00:00 ― 7 leggere min

Scopri come ASGDiffusion cambia la generazione di immagini ad alta risoluzione.

2025-04-02T23:14:33+00:00 ― 7 leggere min