Scopri come i tensori organizzano dati complessi su più dimensioni.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Scopri come i tensori organizzano dati complessi su più dimensioni.
― 5 leggere min
La ricerca mostra come il bias dell'attenzione gaussiana migliori la comprensione spaziale nei vision transformers.
― 6 leggere min
Un nuovo metodo aiuta i modelli a imparare da un solo esempio di dati.
― 6 leggere min
Un nuovo dataset migliora l'accuratezza del matching testo-immagine.
― 5 leggere min
SHS-Net offre un nuovo metodo per stimare le normali orientate da nuvole di punti.
― 6 leggere min
D-Net migliora l'analisi delle nuvole di punti identificando punti distintivi chiave.
― 6 leggere min
Un nuovo metodo migliora la precisione dell'etichettatura nella segmentazione delle immagini.
― 4 leggere min
Un nuovo metodo migliora le mappe di profondità usando due tipi di telecamere per la robotica.
― 6 leggere min
Esplorare nuovi metodi per migliorare l'accuratezza della classificazione multi-etichetta.
― 5 leggere min
Uno sguardo a come le macchine possono riconoscere meglio gli oggetti come gli esseri umani.
― 6 leggere min
Un nuovo approccio non supervisionato migliora la sincronizzazione delle rotazioni senza richiedere tanti dati.
― 6 leggere min
Questa ricerca migliora la traduzione automatica di testi da immagini usando più modelli insegnanti.
― 5 leggere min
Metodi per migliorare i modelli di visione artificiale contro le distorsioni delle immagini.
― 7 leggere min
Quest'articolo esamina i metodi per migliorare la qualità delle immagini usando il deep learning.
― 6 leggere min
Un nuovo metodo migliora il modellamento 3D delle forme da punti di vista singoli usando immagini combinate.
― 6 leggere min
Un nuovo metodo migliora il riconoscimento delle azioni concentrandosi su tempistica e movimento.
― 5 leggere min
Uno studio sulle prestazioni di SAM di fronte a diverse sfide del mondo reale.
― 7 leggere min
Un approccio nuovo combina caratteristiche visive e conoscenze esterne per migliorare le risposte alle domande.
― 6 leggere min
Un nuovo metodo migliora i modelli 3D dettagliati degli edifici per vari usi.
― 6 leggere min
Un nuovo modello basato su transformer migliora l'accuratezza dell'odometria visiva monoculare.
― 8 leggere min
Un nuovo framework migliora il riconoscimento delle azioni da video campionati limitati.
― 5 leggere min
Un nuovo metodo migliora le prestazioni della classificazione visiva in compiti difficili.
― 5 leggere min
Uno studio su come migliorare il riconoscimento degli oggetti in condizioni rumorose per le auto a guida autonoma.
― 5 leggere min
EfficientViT migliora la velocità e l'efficienza nei vision transformers per applicazioni in tempo reale.
― 4 leggere min
Nuovo metodo genera immagini interne complete da viste limitate.
― 6 leggere min
Esplorando nuovi metodi per riconoscere oggetti mai visti nella visione artificiale.
― 7 leggere min
Un metodo per stimare la sensibilità spettrale della fotocamera senza attrezzatura specializzata.
― 9 leggere min
SAM ridefinisce la segmentazione delle immagini con capacità di riconoscimento degli oggetti flessibili.
― 5 leggere min
Introduzione di tecniche per gestire meglio i riflessi nei dati delle nuvole di punti.
― 5 leggere min
Un nuovo sistema migliora il rilevamento delle consegne usando telecamere di campanelli smart.
― 8 leggere min
La ricerca affronta le sfide nel prevedere il comportamento degli oggetti con nuovi dataset.
― 6 leggere min
Nuove tecniche aiutano i robot a afferrare le borse di plastica trasparenti in modo più efficace.
― 7 leggere min
RHINO migliora l'accuratezza del rilevamento degli oggetti per gli oggetti ruotati nelle immagini aeree.
― 5 leggere min
Il clustering aiuta a individuare schemi nei dati in diversi settori.
― 4 leggere min
Nuovo metodo migliora la resistenza delle reti neurali agli attacchi avversari usando tecniche NAS.
― 8 leggere min
Uno studio svela punti di forza e debolezza dei grandi modelli nel gestire testi nelle immagini.
― 5 leggere min
Un nuovo metodo migliora il video question answering analizzando le connessioni tra eventi.
― 6 leggere min
Un metodo in due fasi per rimuovere la pioggia dalle immagini per una visibilità migliore.
― 5 leggere min
Una panoramica delle tecniche di segmentazione delle immagini e delle loro applicazioni.
― 7 leggere min
ULIP-2 automatizza la generazione di linguaggio per forme 3D, migliorando la gestione dei dati.
― 6 leggere min