Un nuovo approccio migliora il captioning delle immagini con tecniche che tengono conto della posizione.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo approccio migliora il captioning delle immagini con tecniche che tengono conto della posizione.
― 6 leggere min
Esaminare il contenuto e la replica del movimento nei modelli di generazione video.
― 9 leggere min
Nuovo sistema migliora il rilevamento degli oggetti usando fonti di dati diverse.
― 6 leggere min
Un nuovo metodo migliora l'apprendimento auto-supervisionato concentrandosi su coppie di immagini di alta qualità.
― 5 leggere min
Introduzione a GlORIE-SLAM, un nuovo sistema SLAM solo RGB.
― 7 leggere min
Esaminando l'emergere di caratteristiche nei modelli di generazione di immagini e audio.
― 7 leggere min
Un nuovo metodo usa il reinforcement learning per potare le CNN mentre vengono addestrate.
― 8 leggere min
Un nuovo approccio migliora la precisione nell'allineamento dei grafi 3D delle scene per compiti spaziali.
― 6 leggere min
Un nuovo modello genera movimenti realistici nelle conversazioni, migliorando la comprensione dell'interazione.
― 5 leggere min
BAMM trasforma le descrizioni testuali in movimenti umani realistici senza problemi.
― 5 leggere min
Un nuovo metodo migliora la navigazione dei robot usando il linguaggio e la mappatura visiva.
― 10 leggere min
Un nuovo metodo migliora il rilevamento OOD concentrandosi sulle informazioni di gradiente.
― 6 leggere min
Un nuovo metodo riduce l'input manuale necessario per la ricostruzione di scene 3D.
― 5 leggere min
Un nuovo metodo per migliorare il rilevamento degli oggetti affrontando il problema dello sbilanciamento tra classi.
― 6 leggere min
Un nuovo framework migliora l'accuratezza dei sottotitoli video nonostante manchino input.
― 7 leggere min
D'OH offre nuovi modi per rappresentare i segnali in modo efficiente.
― 7 leggere min
MoDiTalker offre una qualità e una velocità migliorate nella creazione di video con teste parlate realistici.
― 5 leggere min
CLAP migliora il machine learning aumentando la retention delle conoscenze pregresse.
― 7 leggere min
MambaMixer migliora l'efficienza del deep learning per immagini e previsioni di serie temporali.
― 7 leggere min
Le tecniche di visione attiva migliorano la resilienza del deep learning contro gli input avversariali.
― 5 leggere min
Nuovi metodi migliorano la mappatura dei campi coltivati in regioni con dati limitati.
― 9 leggere min
Nuovo metodo usa telecamere a profondità per identificare le mucche con precisione nelle fattorie di latte.
― 9 leggere min
Una nuova tecnica cattura scene dinamiche di città usando dati da veicoli in movimento.
― 8 leggere min
Nuovo metodo migliora la correzione del movimento nelle scansioni PET cardiache.
― 7 leggere min
Un nuovo metodo migliora l'imaging 4DCT per una terapia più sicura contro il cancro ai polmoni.
― 6 leggere min
Questo documento parla dei costi e dei miglioramenti per le reti neurali a bassa precisione.
― 5 leggere min
Le innovazioni dell'AI migliorano la rilevazione e la diagnosi delle fratture costali per una migliore assistenza ai pazienti.
― 7 leggere min
L'adattamento per diffusione generalizzata migliora le performance del modello con campioni fuori distribuzione.
― 7 leggere min
Migliorare il rilevamento di oggetti grandi negli ambienti dei veicoli autonomi.
― 6 leggere min
Introducendo il Prompting Convoluzionale per migliorare l'adattamento delle macchine senza dimenticare.
― 8 leggere min
Un nuovo metodo di rete neurale migliora l'imaging ecografico 3D dei vasi sanguigni.
― 7 leggere min
Un approccio di deep learning per stimare con precisione l'altezza degli alberi usando dati radar.
― 7 leggere min
SPHINX-V migliora la capacità dell'IA di interpretare le immagini tramite l'interazione dell'utente.
― 6 leggere min
Nuovi metodi migliorano la comprensione del deep learning nella mammografia.
― 7 leggere min
Nuovi metodi migliorano il rilevamento delle azioni nei video contro varie corruzioni.
― 6 leggere min
Un nuovo metodo migliora come i modelli rappresentano le relazioni tra gli oggetti nelle immagini generate.
― 6 leggere min
Un nuovo dataset migliora i metodi di tracciamento usando immagini RGB e termiche.
― 7 leggere min
La tecnologia Talk3D migliora la creazione di video con teste parlanti super realistici, sincronizzando l'audio.
― 5 leggere min
HITL combina l'esperienza umana e l'apprendimento automatico per migliorare il trattamento del cancro al seno.
― 6 leggere min
Un nuovo approccio per ridurre l'oblio nelle macchine usando i principi dell'apprendimento umano.
― 7 leggere min