Presentiamo MS-Bot, un metodo per i robot di usare in modo adattivo più sensi durante i compiti.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
Presentiamo MS-Bot, un metodo per i robot di usare in modo adattivo più sensi durante i compiti.
― 7 leggere min
Un nuovo metodo per aiutare le macchine a imparare nuove categorie senza dimenticare quelle vecchie.
― 6 leggere min
Uno studio sulle sfide e le soluzioni per l'allucinazione nei MLLM.
― 4 leggere min
Un framework per affrontare il rumore nei dati nelle tecniche di recupero cross-modale.
― 5 leggere min
Un nuovo approccio che migliora la comprensione delle macchine dei dati visivi provenienti da fonti diverse.
― 5 leggere min
Tecniche efficaci per rilevare i rifiuti di plastica nei nostri oceani.
― 5 leggere min
Un nuovo metodo migliora la diagnosi di polmonite usando tecniche di deep learning.
― 8 leggere min
Nuovo metodo migliora l'abbinamento tra schizzi fatti a mano e immagini di identificazione utilizzando dati sintetici.
― 6 leggere min
Uno studio rivela potenziali perdite di informazioni personali da parte dei VLM.
― 6 leggere min
MHSSMamba migliora l'accuratezza nell'elaborazione e classificazione delle immagini iperspettrali.
― 5 leggere min
Introducendo un metodo per migliorare la misura della turbolenza e la chiarezza delle immagini infrarosse.
― 6 leggere min
Nuovo metodo migliora il rilevamento delle curve nelle immagini mediche per diagnosi migliori.
― 7 leggere min
Un nuovo modo di analizzare come i modelli immagine resistono ai cambiamenti di input.
― 5 leggere min
Nuovi metodi migliorano l'accuratezza nella rilevazione di oggetti salienti in immagini ad alta risoluzione.
― 5 leggere min
HiSTN usa dati EEG per classificare le emozioni in modo efficace con poche risorse.
― 5 leggere min
Uno sguardo a IG-SLAM e il suo impatto sulla tecnologia di mappatura in tempo reale.
― 5 leggere min
Un nuovo framework migliora il riconoscimento degli oggetti nelle immagini usando il testo.
― 6 leggere min
Un nuovo metodo migliora il ripristino delle immagini ottimizzando i modelli in modo efficiente.
― 6 leggere min
Nuove tecniche migliorano la visibilità degli strumenti chirurgici durante le procedure laparoscopiche.
― 6 leggere min
Un metodo nuovo migliora le previsioni sul comportamento dei pedoni per la sicurezza dei veicoli.
― 6 leggere min
Un nuovo modello migliora l'accuratezza della misurazione della placenta dalle immagini ecografiche 3D.
― 5 leggere min
Nuovo metodo migliora la privacy per i vision transformer nel machine learning.
― 6 leggere min
Nuovo metodo migliora il rilevamento delle anomalie nelle immagini mediche senza etichette precedenti.
― 6 leggere min
Un nuovo metodo usa l'imaging retinico per identificare i segni precoci di demenza.
― 6 leggere min
Questo metodo migliora la sicurezza nella generazione di immagini mantenendo la qualità.
― 6 leggere min
Un nuovo metodo usa immagini per studiare i tratti e l'evoluzione delle specie.
― 6 leggere min
Nuovo approccio nella traccia grafica migliora l'accuratezza e l'efficienza della mappatura cerebrale.
― 5 leggere min
Un'app innovativa aiuta gli utenti a riconoscere e nominare i colori in modo efficace.
― 7 leggere min
Nuovo metodo migliora l'accuratezza della segmentazione del disco ottico e della coppa nelle immagini retiniche.
― 7 leggere min
FBINeRF migliora il rendering 3D per telecamere normali e fisheye.
― 6 leggere min
Due robot che lavorano insieme migliorano la localizzazione degli oggetti senza un addestramento precedente.
― 7 leggere min
Un nuovo metodo migliora l'apprendimento semi-supervisionato utilizzando i dati OOD in modo efficace.
― 9 leggere min
Un nuovo framework migliora la classificazione delle malattie dalle immagini mediche nonostante le diverse condizioni dei dati.
― 6 leggere min
MiniCPM-V migliora l'uso dell'AI sui dispositivi mobili con efficienza e performance.
― 6 leggere min
Un nuovo modello migliora il riconoscimento delle azioni dei conducenti usando diversi tipi di video.
― 6 leggere min
Nuovo modello migliora la sincronizzazione labiale e la qualità visiva nei video di persone che parlano.
― 6 leggere min
Un nuovo framework migliora il modo in cui valutiamo le didascalie delle immagini usando modelli linguistici.
― 8 leggere min
Introducendo un modello per chiarire le ambiguità nelle immagini binarie dei bordi.
― 5 leggere min
AVESFormer migliora la segmentazione audio-visiva in tempo reale con decodifica efficiente e attenzione potenziata.
― 5 leggere min
Esaminando le vulnerabilità nei transformer visivi e nei modelli downstream attraverso attacchi di trasferimento.
― 6 leggere min