Un metodo che migliora la classificazione delle immagini per più oggetti nel tempo.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Un metodo che migliora la classificazione delle immagini per più oggetti nel tempo.
― 5 leggere min
Un nuovo modello migliora l'etichettatura delle immagini usando più fonti di dati.
― 6 leggere min
Un nuovo metodo migliora i modelli da testo a immagine usando grafi di scena strutturati.
― 6 leggere min
Un nuovo metodo migliora la selezione degli esempi per i compiti di apprendimento visivo.
― 7 leggere min
Esplorando il ruolo dei dati sintetici nel migliorare i sistemi di rilevamento umano aereo.
― 6 leggere min
Esplorare l'uso dei LLM per migliorare compiti di visione a basso livello come la rimozione del rumore e la sfocatura.
― 7 leggere min
Un nuovo metodo per creare dataset automaticamente migliora l'efficienza del machine learning.
― 5 leggere min
Un nuovo metodo combina token tangibili e intangibili per una migliore comprensione visiva.
― 5 leggere min
Questo articolo parla dei modelli di previsione video e del loro utilizzo nei compiti di segmentazione delle istanze.
― 6 leggere min
Un nuovo metodo punta a migliorare la sicurezza della generazione di immagini da testo.
― 7 leggere min
Un nuovo approccio collega i dati visivi con i loro significati per una ragionamento migliore.
― 6 leggere min
Un nuovo sistema ibrido combina metodi ottici ed elettronici per una classificazione delle immagini più efficiente.
― 7 leggere min
Deep-PE migliora l'accuratezza nella selezione delle pose in scenari di nuvole di punti a bassa sovrapposizione.
― 7 leggere min
Un nuovo metodo migliora la stima del movimento usando reti di elementi finiti adattive.
― 5 leggere min
DMPlug migliora i metodi di recupero per problemi inversi usando modelli di diffusione pre-addestrati.
― 8 leggere min
Un nuovo modello migliora i Transformers combinando informazioni sensoriali e relazionali.
― 7 leggere min
CoACT migliora la capacità dei modelli di base di apprendere nuove classi in modo efficiente.
― 7 leggere min
Un nuovo approccio migliora la mappatura e il tracciamento usando immagini RGB.
― 8 leggere min
Un nuovo metodo semplifica la creazione di immagini personalizzate a partire da un'immagine unica e un testo breve.
― 8 leggere min
Un nuovo benchmark punta a migliorare la comprensione dell'IA di testi e immagini.
― 7 leggere min
Scopri come l'apprendimento profondo ipercomplesso migliora l'elaborazione dei dati e le prestazioni del modello.
― 6 leggere min
Presentiamo SparseSplat360 per affrontare la ricostruzione 3D da immagini limitate.
― 7 leggere min
CHAMP migliora la stima della posa 3D usando i punti chiave 2D dei video.
― 5 leggere min
Presentiamo un nuovo metodo per una stima della profondità migliorata usando dati non etichettati.
― 6 leggere min
Questo articolo esplora le U-Net e il loro ruolo nell'elaborazione delle immagini usando modelli generativi.
― 7 leggere min
UniTraj affronta le sfide della modellazione delle traiettorie multi-agente con un approccio unificato.
― 11 leggere min
SADA migliora la stabilità dell'allenamento nel reinforcement learning visivo con tecniche avanzate di data augmentation.
― 6 leggere min
Una nuova tecnica migliora l'accuratezza della stima della posa 3D nonostante dati mancanti.
― 6 leggere min
SynCx migliora la scoperta degli oggetti usando pesi a valori complessi e processi iterativi.
― 8 leggere min
GenWarp genera nuove visuali da singole immagini mantenendo i dettagli essenziali.
― 5 leggere min
Un nuovo metodo migliora le prestazioni del modello usando dati con etichette rumorose.
― 7 leggere min
Un modello semplificato per una navigazione efficace usando istruzioni in linguaggio naturale.
― 11 leggere min
Includere dati non in inglese migliora le prestazioni dei modelli visione-linguaggio e la comprensione culturale.
― 6 leggere min
Presentiamo TokenUnify, un metodo che migliora la segmentazione delle immagini grazie a tecniche di allenamento innovative.
― 6 leggere min
Introducendo un nuovo metodo per creare immagini realistiche da una sola fonte.
― 7 leggere min
Approccio innovativo per creare viste stradali chiare dai filmati video in auto.
― 8 leggere min
Nuovo framework migliora il riconoscimento delle immagini in diversi ambiti usando descrizioni linguistiche.
― 7 leggere min
Un nuovo metodo migliora l'accuratezza del modello con semplici regolazioni.
― 7 leggere min
Un nuovo metodo migliora il rilevamento dei punti facciali senza dati etichettati.
― 6 leggere min
Un nuovo approccio aiuta i robot a collegare i dati visivi con le azioni.
― 7 leggere min