Jingdong Wang

Apprendimento automatico Progressi nel Riconoscimento di Entità Nominate Multimodali

BGA-MNER migliora le connessioni tra testo e immagine per una migliore riconoscimento delle entità.

2025-10-12T20:46:48+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Avanzamenti nel riconoscimento delle azioni con pochi esempi grazie a MA-CLIP

MA-CLIP migliora il riconoscimento delle azioni usando pochi esempi e una migliore integrazione di video e testo.

2025-10-12T12:29:06+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Progresso nel Rendering di Scene Dinamiche

Un nuovo metodo migliora il rendering di scene dinamiche usando tecniche di warping in avanti.

2025-09-20T06:18:48+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la segmentazione delle immagini di riferimento con CPRN

Un nuovo framework migliora la segmentazione degli oggetti basata su descrizioni in linguaggio naturale.

2025-09-15T05:26:36+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Struttura Unificata per il Miglioramento della Rilevazione del Testo

Un nuovo framework porta un miglioramento nella rilevazione del testo su più formati e granularità.

2025-08-04T13:26:06+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Avanzamenti nella rilevazione di oggetti 3D con BEVSpread

BEVSpread migliora l'accuratezza del rilevamento degli oggetti per una guida più sicura.

2025-07-30T04:24:06+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nell'animazione delle immagini dei ritratti usando l'audio

Nuovi metodi migliorano le animazioni facciali realistiche sincronizzate con l'audio.

2025-07-29T02:51:30+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Valutare la Generazione di Video: Il Protocollo DEVIL

Un nuovo metodo per valutare i modelli da testo a video si concentra sulla dinamica.

2025-07-21T10:07:48+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Avanzando nella rilevazione 3D degli oggetti con profondità specifica per oggetto

Un approccio nuovo che si concentra sulla profondità degli oggetti migliora l'accuratezza nella rilevazione 3D.

2025-07-13T06:12:36+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare il riconoscimento 3D degli oggetti con il metodo SEED

SEED migliora il rilevamento di oggetti 3D usando la selezione doppia delle query e l'attenzione a griglia deformabile.

2025-07-13T06:04:42+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nei Avatar Digitali Umani Realistici

Un nuovo metodo per creare avatar digitali realistici dai video.

2025-07-09T12:48:30+00:00 ― 4 leggere min

Visione artificiale e riconoscimento di modelli Progressi nella rilevazione di oggetti 3D con RNN a gruppo lineare

Nuovo metodo migliora precisione ed efficienza nella rilevazione di oggetti 3D usando Linear Group RNN.

2025-07-07T03:32:00+00:00 ― 4 leggere min

Visione artificiale e riconoscimento di modelli Add-SD: Un Nuovo Approccio all'Editazione delle Immagini

Add-SD semplifica la modifica delle immagini permettendo aggiunte di oggetti realistici tramite input testuali.

2025-07-05T02:09:30+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli ReSyncer: Un Nuovo Approccio al Lip-Syncing

ReSyncer migliora la qualità video e la flessibilità per i movimenti delle labbra sincronizzati con l'audio.

2025-07-01T12:18:42+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare l'Annotazione delle Immagini con il Sistema FullAnno

FullAnno migliora le annotazioni delle immagini per un migliore addestramento dei modelli multimodali.

2025-06-08T20:15:54+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Un approccio unificato alla generazione di testo e immagini

Questo articolo presenta un nuovo modello che combina la generazione di testo e immagini in un unico sistema.

2025-06-06T22:34:36+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Progressi nella Scoperta di Categorie Generalizzate con FlipClass

FlipClass offre un nuovo metodo per un apprendimento migliore nella Scoperta di Categorie Generalizzate.

2025-06-03T10:26:30+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli ALoRE: Soluzioni Intelligenti per il Riconoscimento delle Immagini

ALoRE ottimizza l'addestramento dei modelli per un riconoscimento delle immagini efficiente e applicazioni più ampie.

2025-03-20T03:48:36+00:00 ― 7 leggere min