DAF-Net unisce immagini infrarosse e visibili per avere idee più chiare.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
DAF-Net unisce immagini infrarosse e visibili per avere idee più chiare.
― 5 leggere min
I robot possono ora usare le espressioni facciali per mostrare il dolore, aiutando nella formazione sanitaria.
― 6 leggere min
VALO ottimizza il rilevamento LiDAR per veicoli autonomi, bilanciando velocità e precisione.
― 5 leggere min
NVLM migliora la comprensione del linguaggio e delle immagini da parte dell'AI per vari compiti.
― 6 leggere min
Usare l'IA per migliorare la diagnosi precoce delle malattie retiniche tramite tecniche di imaging avanzate.
― 8 leggere min
RenderWorld usa dati visivi per una tecnologia di guida autonoma più sicura.
― 5 leggere min
OmniGen semplifica i compiti di creazione di immagini in un unico modello per tutti gli utenti.
― 6 leggere min
Questo lavoro migliora l'accuratezza di CLIP affrontando la sovrapposizione intra-modale utilizzando adattatori leggeri.
― 5 leggere min
LPT++ migliora il riconoscimento degli oggetti in classi con pochi esempi grazie a tecniche avanzate.
― 7 leggere min
Un nuovo framework migliora la segmentazione con esempi limitati.
― 6 leggere min
Un nuovo approccio migliora l'accuratezza nella rilevazione della stenosi aortica tramite il machine learning.
― 6 leggere min
SLAck offre un nuovo modo di tenere traccia di oggetti diversi nei video.
― 6 leggere min
Viene introdotto un benchmark per la segmentazione generalizzata a pochi colpi nel telerilevamento.
― 5 leggere min
Un nuovo metodo combina video, audio e algoritmi per una migliore rilevazione delle anomalie.
― 7 leggere min
Uno sguardo alla Distillazione del Dimenticanza del Punteggio e il suo impatto sull'AI generativa.
― 6 leggere min
SplatFields migliora l'imaging 3D da angolazioni di ripresa limitate, aumentando dettagli e qualità.
― 7 leggere min
Usare dati sintetici per migliorare gli strumenti di mobilità per le persone cieche e con problemi di vista.
― 7 leggere min
Questo articolo esamina l'affidabilità dei modelli MIL nelle applicazioni cliniche.
― 5 leggere min
Un nuovo metodo migliora la stima della posa usando immagini RGB supportate da dati di profondità.
― 6 leggere min
OneEncoder collega in modo efficiente immagini, testo, audio e video per migliorare l'elaborazione delle informazioni.
― 7 leggere min
Nuovi metodi migliorano l'accuratezza e l'efficienza nel riconoscere oggetti simili.
― 5 leggere min
Impara a valutare e confrontare le immagini in modo efficace.
― 5 leggere min
Questo modello migliora l'apprendimento dell'IA mantenendo le conoscenze passate.
― 6 leggere min
Un nuovo sistema migliora le previsioni di sicurezza per i veicoli autonomi in ambienti difficili.
― 7 leggere min
KALE usa i metadati per generare didascalie interessanti per le opere d'arte.
― 6 leggere min
TrajSSL migliora il rilevamento di oggetti 3D usando meno dati etichettati grazie alla previsione del movimento.
― 7 leggere min
Esplorare come i LLM migliorano il ragionamento su vari tipi di dati.
― 8 leggere min
Scopri come FlexiTex migliora la generazione di texture 3D grazie a una guida visiva.
― 6 leggere min
Nuovo modello migliora l'accuratezza nella classificazione delle lesioni della pelle usando più tipi di dati.
― 5 leggere min
Un nuovo framework stima con precisione la profondità da singole immagini sfocate.
― 6 leggere min
Uno studio rivela lacune nelle prestazioni dei sistemi RIdV tra diverse demografie.
― 5 leggere min
I Transformers migliorano l'accuratezza della classificazione per il Disturbo dello Spettro Autistico grazie all'analisi avanzata delle immagini cerebrali.
― 7 leggere min
GCA-SUN migliora il conteggio degli oggetti nelle immagini senza esempi etichettati.
― 6 leggere min
Un nuovo metodo riduce il fabbisogno di dati per addestrare i robot con dimostrazioni visive.
― 5 leggere min
Un nuovo framework integra l'aggiustamento dei bundle con PyTorch per migliorare la modellazione 3D.
― 6 leggere min
Nuove tecniche migliorano le previsioni della disponibilità di energia solare usando immagini del cielo.
― 6 leggere min
Un nuovo metodo mescola audio e espressioni facciali per generare video realistici.
― 6 leggere min
MoRAG migliora la generazione del movimento umano da descrizioni testuali usando il recupero specifico per parti.
― 5 leggere min
Migliorare l'efficienza dei modelli nel remote sensing usando tecniche di distillazione della conoscenza.
― 6 leggere min
Nuovi metodi migliorano la separazione delle misurazioni dell'altezza del mare per un'analisi migliore della dinamica oceanica.
― 6 leggere min