Una nuova metrica migliora l'accuratezza del riconoscimento delle immagini riducendo i costi computazionali.
― 8 leggere min
Scienza all'avanguardia spiegata semplicemente
Una nuova metrica migliora l'accuratezza del riconoscimento delle immagini riducendo i costi computazionali.
― 8 leggere min
Nuove strategie migliorano la qualità dell'immagine nei modelli di diffusione.
― 5 leggere min
Un nuovo modello che genera movimenti umani stilizzati da sequenze di testo e stile.
― 7 leggere min
Un nuovo metodo migliora il controllo del movimento della camera nella generazione video.
― 6 leggere min
Un nuovo metodo migliora il modeling 3D degli esseri umani partendo da poche foto.
― 7 leggere min
Analizzando l'importanza e le difficoltà di valutare i modelli di intelligenza artificiale multimodali.
― 6 leggere min
LookupViT migliora i compiti di riconoscimento visivo tramite un'elaborazione efficiente dei token.
― 6 leggere min
GroundUp semplifica il processo di design per gli architetti urbanisti usando una tecnologia innovativa di modellazione 3D.
― 5 leggere min
Il framework CHOSEN migliora i Vision Transformers per un uso efficiente degli FPGA.
― 5 leggere min
Uni-Food offre una risorsa completa per la ricerca sul cibo con immagini e dati nutrizionali.
― 6 leggere min
Il nuovo modello combina il linguaggio naturale e il contatto 3D tra mani e oggetti per un realismo maggiore.
― 4 leggere min
Un nuovo sistema per esperienze di abbigliamento online personalizzate.
― 6 leggere min
L'IA migliora la rilevazione precoce dei polipi colorettali tramite tecniche di imaging avanzate.
― 7 leggere min
Un nuovo approccio migliora la comprensione di video lunghi, affrontando sfide chiave.
― 6 leggere min
Un nuovo metodo migliora la segmentazione semi-supervisionata concentrandosi su pseudo-etichettature affidabili.
― 7 leggere min
Un nuovo approccio migliora la segmentazione degli organi nelle immagini mediche usando dataset parzialmente etichettati.
― 7 leggere min
I nuovi modelli a singolo stadio superano i metodi tradizionali per rilevare le fratture al polso nei giovani.
― 11 leggere min
Uno sguardo a come le macchine stanno migliorando l'elaborazione dei documenti senza OCR.
― 7 leggere min
Nuove telecamere per eventi migliorano il riconoscimento della lingua dei segni e l'accuratezza della traduzione, migliorando gli strumenti di comunicazione.
― 5 leggere min
Un nuovo metodo unisce i dati delle telecamere a eventi e delle telecamere a frame per una migliore rilevazione degli oggetti.
― 5 leggere min
Un metodo che migliora il machine learning per riconoscere meglio le categorie rare.
― 7 leggere min
Nuovi metodi migliorano la comprensione delle interazioni cerebrali nei pazienti colpiti da ictus.
― 6 leggere min
HDRSplat migliora l'accuratezza del modellamento 3D in condizioni di scarsa illuminazione.
― 5 leggere min
MERLIN migliora la ricerca video coinvolgendo gli utenti con feedback interattivo.
― 6 leggere min
Questo articolo esamina l'efficacia dei modelli multimodali che usano dati linguistici e visivi.
― 8 leggere min
Sviluppare metodi adattivi per la segmentazione dei dati 3D per identificare nuove classi di oggetti.
― 6 leggere min
VARS usa l'analisi video per supportare gli arbitri a tutti i livelli del calcio.
― 5 leggere min
Presentiamo un nuovo metodo per una migliore segmentazione delle immagini senza dover etichettare tanto.
― 7 leggere min
GLARE migliora le immagini in condizioni di scarsa illuminazione usando un approccio unico con un codice e controlli per l'utente.
― 5 leggere min
Le tecniche di deep learning sembrano promettenti nel segmentare il pancreas dalle scansioni CT.
― 4 leggere min
Questo studio analizza come i moderni metodi VPR migliorano la fusione delle submap nei sistemi di SLAM visivo.
― 6 leggere min
DeepClean automatizza l'identificazione e la correzione delle distorsioni nelle immagini.
― 6 leggere min
Presentiamo GOAR, un metodo per capire meglio l'importanza delle caratteristiche nell'IA.
― 6 leggere min
Un nuovo framework migliora l'accuratezza nella rilevazione dei polipi nell'imaging gastrointestinale.
― 5 leggere min
FETCH migliora l'uso della memoria mantenendo l'accuratezza nei compiti di machine learning.
― 7 leggere min
Combinare la comprensione del linguaggio e la visione migliora le capacità di navigazione dei robot.
― 7 leggere min
Un nuovo strumento aiuta gli utenti a sistemare i disallineamenti nelle embedding multimodali.
― 6 leggere min
La ricerca mette in evidenza metodi per rilevare informazioni false nell'IA automobilistica.
― 8 leggere min
Nuovo modello migliora la precisione delle previsioni delle immagini e la chiarezza delle spiegazioni.
― 8 leggere min
Un nuovo metodo migliora la generazione di immagini per la guida autonoma in condizioni avverse.
― 4 leggere min