Nuovo modello di intelligenza artificiale migliora l'interpretazione delle radiografie del torace per diagnosi migliori.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
Nuovo modello di intelligenza artificiale migliora l'interpretazione delle radiografie del torace per diagnosi migliori.
― 7 leggere min
Articoli più recenti
TemporalStory migliora la generazione di immagini per il racconto di storie rendendo tutto più coerente e contestualizzato.
― 5 leggere min
Un nuovo strumento per valutare la replicazione nella musica creata dall'IA.
― 7 leggere min
Uno sguardo ai metodi per migliorare la qualità delle immagini colpite dalla foschia.
― 6 leggere min
Il dataset TGIF aiuta a rilevare tecniche avanzate di manipolazione delle immagini.
― 5 leggere min
Scopri come la trasmissione IP e il tagging audio stanno ridefinendo la distribuzione dei contenuti.
― 5 leggere min
Integrare l'IA per migliorare le strategie di marketing e l'efficacia delle campagne.
― 7 leggere min
X-Former migliora come i modelli combinano la comprensione di immagini e testo.
― 8 leggere min
Contrastare le informazioni fuorvianti con nuovi metodi e tecnologie.
― 5 leggere min
Un nuovo sistema che combina analisi del testo e delle immagini per combattere la disinformazione.
― 5 leggere min
Il nuovo metodo RoE migliora l'efficienza dei modelli di linguaggio multi-modali con un routing dinamico.
― 7 leggere min
Presentiamo 360VFI per una qualità e un'esperienza video a 360 gradi migliorate.
― 6 leggere min
Un nuovo modello combina audio e video per una comprensione migliore.
― 6 leggere min
Un nuovo metodo migliora la separazione delle voci in ambienti rumorosi con più parlanti.
― 5 leggere min
Questo studio esamina i metodi di campionamento dei fotogrammi per migliorare il recupero dei contenuti video.
― 6 leggere min
Un nuovo framework semplifica la creazione di clip evidenziate specifiche per i giocatori dai video di calcio.
― 7 leggere min
HaloQuest affronta i problemi di allucinazione nei modelli vision-linguistici con un nuovo dataset.
― 10 leggere min
Un nuovo framework migliora il recupero di oggetti 3D da diversi tipi di dati.
― 5 leggere min
Esaminando il processo creativo dietro la produzione di video di notizie false.
― 7 leggere min
QPT V2 migliora la valutazione visiva usando il modeling di immagini mascherate e dati di alta qualità.
― 6 leggere min
MMTrail combina descrizioni visive e audio per modelli video-linguistici migliori.
― 5 leggere min
Nuovo metodo rinforza la privacy per immagini e testi condivisi.
― 6 leggere min
Un nuovo metodo migliora le prestazioni dell'AVQA quando mancano input audio o visivi.
― 5 leggere min
Un metodo per creare audio che si abbina ai video in prima persona.
― 7 leggere min
Una collezione varia di modelli 3D per opportunità di ricerca migliorate.
― 6 leggere min
Questo studio esamina quanto bene i LLM comprendano e generino musica.
― 5 leggere min
Un nuovo modello che sincronizza le annotazioni degli accordi con l'audio musicale senza problemi.
― 6 leggere min
Un modello unificato migliora la compressione delle nuvole di punti per una qualità e un'efficienza migliori.
― 7 leggere min
Un metodo innovativo aggiunge messaggi nascosti per garantire l'autenticità delle immagini.
― 5 leggere min
Un framework che identifica efficacemente i contenuti deepfake attraverso l'analisi combinata di audio e video.
― 5 leggere min
Un nuovo parametro per valutare i modelli che analizzano musica e linguaggio.
― 6 leggere min
Un nuovo approccio unisce dati audio, video e testuali per una diagnosi efficace della depressione.
― 8 leggere min
Un nuovo framework migliora la classificazione in compiti audio-visivi mai visti.
― 7 leggere min
Un nuovo modello migliora la segmentazione della silhouette usando segnali RF per una cattura del movimento migliore.
― 6 leggere min
Nuovo dataset fornisce spunti sul linguaggio d'odio in diverse lingue e formati.
― 6 leggere min
Nuovo framework migliora l'elaborazione delle immagini nei modelli di linguaggio multimodali.
― 4 leggere min
AxiomVision offre un nuovo modo di analizzare i video, migliorando le prestazioni in condizioni che cambiano.
― 6 leggere min
Nuovi sistemi uniscono audio e video per una migliore rilevazione della violenza negli spazi pubblici.
― 6 leggere min
Un nuovo sistema migliora le videochiamate su visori VR economici usando il controllo vocale.
― 7 leggere min
Una guida chiara sui tipi di manoscritti e le sfide di invio.
― 5 leggere min
Un nuovo metodo migliora il riconoscimento degli oggetti nei video attraverso suoni e segnali visivi.
― 5 leggere min