Questo articolo parla di un nuovo benchmark per unire immagini e testo per trovare eventi nei video.
― 8 leggere min
Scienza all'avanguardia spiegata semplicemente
Questo articolo parla di un nuovo benchmark per unire immagini e testo per trovare eventi nei video.
― 8 leggere min
CRAB migliora i test per i modelli linguistici in ambienti reali.
― 7 leggere min
I modelli VQA possono rivelare informazioni private nonostante le tecniche avanzate.
― 4 leggere min
Un nuovo metodo migliora l'editing delle immagini grazie a istruzioni più chiare.
― 5 leggere min
Questo articolo parla dei problemi di sicurezza nei modelli da testo a immagine e propone delle soluzioni.
― 7 leggere min
Un nuovo metodo per far navigare i robot in modo efficace senza bisogno di un addestramento intenso.
― 6 leggere min
Un progetto che offre descrizioni di opere d'arte in 28 lingue per coinvolgere di più.
― 5 leggere min
Uno sguardo alle sfide del riconoscimento delle forme per le macchine e la strada da percorrere.
― 5 leggere min
Questo metodo semplifica la creazione di match-cut per i filmmaker di tutti i livelli.
― 5 leggere min
Un nuovo metodo per potare in modo efficiente i modelli di intelligenza artificiale che generano immagini mantenendo la qualità.
― 6 leggere min
Un nuovo metodo migliora la generazione di video applicando il movimento da un video a un altro.
― 7 leggere min