Esplorare l'integrazione del calcolo quantistico nel riconoscere schizzi disegnati a mano.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Esplorare l'integrazione del calcolo quantistico nel riconoscere schizzi disegnati a mano.
― 6 leggere min
Questo studio propone un nuovo metodo di valutazione per la comprensione video-testo.
― 6 leggere min
Un metodo che combina dati visivi e IMU per una migliore riconoscimento delle azioni.
― 6 leggere min
Un nuovo metodo per animazioni facciali realistiche in tempo reale nella realtà virtuale.
― 7 leggere min
Nuovi metodi e risorse mirano a migliorare l'analisi dell'attività genica nei tessuti.
― 5 leggere min
ActionSwitch rileva azioni nei video in streaming senza bisogno di informazioni di classe precedenti.
― 4 leggere min
Un nuovo sistema migliora la classificazione dei tessuti usando tecniche di deep learning.
― 5 leggere min
Il framework LDSeg migliora l'efficienza e l'accuratezza nella segmentazione delle immagini mediche.
― 5 leggere min
Esplorare la necessità di continuità semantica nei sistemi di IA per una comprensione migliore.
― 7 leggere min
Una nuova metrica migliora l'accuratezza del riconoscimento delle immagini riducendo i costi computazionali.
― 8 leggere min
Nuove strategie migliorano la qualità dell'immagine nei modelli di diffusione.
― 5 leggere min
Un nuovo modello che genera movimenti umani stilizzati da sequenze di testo e stile.
― 7 leggere min
Un nuovo metodo migliora il controllo del movimento della camera nella generazione video.
― 6 leggere min
Un nuovo metodo migliora il modeling 3D degli esseri umani partendo da poche foto.
― 7 leggere min
Analizzando l'importanza e le difficoltà di valutare i modelli di intelligenza artificiale multimodali.
― 6 leggere min
LookupViT migliora i compiti di riconoscimento visivo tramite un'elaborazione efficiente dei token.
― 6 leggere min
GroundUp semplifica il processo di design per gli architetti urbanisti usando una tecnologia innovativa di modellazione 3D.
― 5 leggere min
Il framework CHOSEN migliora i Vision Transformers per un uso efficiente degli FPGA.
― 5 leggere min
Uni-Food offre una risorsa completa per la ricerca sul cibo con immagini e dati nutrizionali.
― 6 leggere min
Il nuovo modello combina il linguaggio naturale e il contatto 3D tra mani e oggetti per un realismo maggiore.
― 4 leggere min
Un nuovo sistema per esperienze di abbigliamento online personalizzate.
― 6 leggere min
L'IA migliora la rilevazione precoce dei polipi colorettali tramite tecniche di imaging avanzate.
― 7 leggere min
Un nuovo approccio migliora la comprensione di video lunghi, affrontando sfide chiave.
― 6 leggere min
Un nuovo metodo migliora la segmentazione semi-supervisionata concentrandosi su pseudo-etichettature affidabili.
― 7 leggere min
Un nuovo approccio migliora la segmentazione degli organi nelle immagini mediche usando dataset parzialmente etichettati.
― 7 leggere min
I nuovi modelli a singolo stadio superano i metodi tradizionali per rilevare le fratture al polso nei giovani.
― 11 leggere min
Uno sguardo a come le macchine stanno migliorando l'elaborazione dei documenti senza OCR.
― 7 leggere min
Nuove telecamere per eventi migliorano il riconoscimento della lingua dei segni e l'accuratezza della traduzione, migliorando gli strumenti di comunicazione.
― 5 leggere min
Un nuovo metodo unisce i dati delle telecamere a eventi e delle telecamere a frame per una migliore rilevazione degli oggetti.
― 5 leggere min
Un metodo che migliora il machine learning per riconoscere meglio le categorie rare.
― 7 leggere min
Nuovi metodi migliorano la comprensione delle interazioni cerebrali nei pazienti colpiti da ictus.
― 6 leggere min
HDRSplat migliora l'accuratezza del modellamento 3D in condizioni di scarsa illuminazione.
― 5 leggere min
MERLIN migliora la ricerca video coinvolgendo gli utenti con feedback interattivo.
― 6 leggere min
Questo articolo esamina l'efficacia dei modelli multimodali che usano dati linguistici e visivi.
― 8 leggere min
Sviluppare metodi adattivi per la segmentazione dei dati 3D per identificare nuove classi di oggetti.
― 6 leggere min
VARS usa l'analisi video per supportare gli arbitri a tutti i livelli del calcio.
― 5 leggere min
Presentiamo un nuovo metodo per una migliore segmentazione delle immagini senza dover etichettare tanto.
― 7 leggere min
GLARE migliora le immagini in condizioni di scarsa illuminazione usando un approccio unico con un codice e controlli per l'utente.
― 5 leggere min
Le tecniche di deep learning sembrano promettenti nel segmentare il pancreas dalle scansioni CT.
― 4 leggere min
Questo studio analizza come i moderni metodi VPR migliorano la fusione delle submap nei sistemi di SLAM visivo.
― 6 leggere min