La ricerca mostra che l'incoerenza tra testo e immagine aumenta con la popolarità dei post sui social.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
La ricerca mostra che l'incoerenza tra testo e immagine aumenta con la popolarità dei post sui social.
― 5 leggere min
Nuovo dataset migliora la generazione audio da descrizioni testuali dettagliate.
― 5 leggere min
Un nuovo strumento per testare i modelli linguistici in ambienti rumorosi.
― 4 leggere min
Un nuovo metodo per creare mesh di riferimento più pulite da forme 3D dinamiche.
― 6 leggere min
Un nuovo metodo riduce la necessità di dati etichettati nei compiti di visione artificiale.
― 6 leggere min
Questo articolo presenta un metodo per generare suoni precisi da video e testo.
― 7 leggere min
Presentiamo un nuovo modello che combina in modo efficiente testo e layout per una migliore comprensione dei documenti.
― 5 leggere min
Un nuovo metodo migliora la gestione dei dati video per una comprensione e un'efficienza migliori.
― 5 leggere min
Il dataset AMEX migliora la comprensione dell'IA sulle interfacce delle app mobili.
― 7 leggere min
Presentiamo i dataset MERGE per migliorare la classificazione delle emozioni nella musica.
― 6 leggere min
Esplorare come i videogiochi possano insegnare abilità di programmazione essenziali in modo efficace e coinvolgente.
― 5 leggere min
Unire suoni e immagini per sistemi di riconoscimento più intelligenti.
― 7 leggere min
VCoME aiuta gli utenti a creare video verbali coinvolgenti facilmente.
― 5 leggere min
I ricercatori vogliono creare suoni che si abbinino a video silenziosi, migliorando l'esperienza degli spettatori.
― 5 leggere min
Un nuovo approccio migliora la chiarezza delle domande generate dalle immagini.
― 7 leggere min
Scopri come proteggere i dati CSV con firme digitali.
― 5 leggere min
Questo metodo migliora la ricerca di immagini combinando in modo efficace immagini e testo.
― 5 leggere min
LeRF combina deep learning e interpolazione per un resizing delle immagini migliore.
― 7 leggere min
Nuovo modello di intelligenza artificiale migliora l'interpretazione delle radiografie del torace per diagnosi migliori.
― 7 leggere min
Un nuovo metodo per creare contenuti coinvolgenti sui social media usando l'AI.
― 7 leggere min
Scopri come l'IA sta trasformando la generazione musicale con BandControlNet.
― 6 leggere min
Un nuovo approccio migliora il rilevamento dei deepfake usando analisi audio-visiva.
― 6 leggere min
Un nuovo metodo migliora il rilevamento della balbuzie combinando dati audio, video e testo.
― 6 leggere min
Uno studio su come migliorare la localizzazione delle sorgenti sonore sfruttando meglio le informazioni audio e visive.
― 8 leggere min
TemporalStory migliora la generazione di immagini per il racconto di storie rendendo tutto più coerente e contestualizzato.
― 5 leggere min
Un nuovo strumento per valutare la replicazione nella musica creata dall'IA.
― 7 leggere min
Uno sguardo ai metodi per migliorare la qualità delle immagini colpite dalla foschia.
― 6 leggere min
Il dataset TGIF aiuta a rilevare tecniche avanzate di manipolazione delle immagini.
― 5 leggere min
Scopri come la trasmissione IP e il tagging audio stanno ridefinendo la distribuzione dei contenuti.
― 5 leggere min
Integrare l'IA per migliorare le strategie di marketing e l'efficacia delle campagne.
― 7 leggere min
X-Former migliora come i modelli combinano la comprensione di immagini e testo.
― 8 leggere min
Contrastare le informazioni fuorvianti con nuovi metodi e tecnologie.
― 5 leggere min
Un nuovo sistema che combina analisi del testo e delle immagini per combattere la disinformazione.
― 5 leggere min
Il nuovo metodo RoE migliora l'efficienza dei modelli di linguaggio multi-modali con un routing dinamico.
― 7 leggere min
Presentiamo 360VFI per una qualità e un'esperienza video a 360 gradi migliorate.
― 6 leggere min
Un nuovo modello combina audio e video per una comprensione migliore.
― 6 leggere min
Un nuovo metodo migliora la separazione delle voci in ambienti rumorosi con più parlanti.
― 5 leggere min
Questo studio esamina i metodi di campionamento dei fotogrammi per migliorare il recupero dei contenuti video.
― 6 leggere min
Un nuovo framework semplifica la creazione di clip evidenziate specifiche per i giocatori dai video di calcio.
― 7 leggere min
HaloQuest affronta i problemi di allucinazione nei modelli vision-linguistici con un nuovo dataset.
― 10 leggere min