Un nuovo sistema semplifica le attività di design 3D in Blender usando modelli AI avanzati.
― 15 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo sistema semplifica le attività di design 3D in Blender usando modelli AI avanzati.
― 15 leggere min
I ricercatori usano l'apprendimento semi-supervisionato per avere previsioni migliori nelle immagini mediche.
― 6 leggere min
Questo articolo parla di come usare le didascalie delle immagini per trovare video in modo efficiente.
― 6 leggere min
Il nuovo modello migliora la stima della profondità usando i dati della telecamera a eventi tramite algoritmi efficienti.
― 8 leggere min
Uno studio sull'impatto del tone mapping sulla qualità video HDR per una visione migliore.
― 6 leggere min
Introducendo un nuovo metodo per migliorare la diversità facciale nei dataset di intelligenza artificiale.
― 6 leggere min
I ricercatori hanno sviluppato un sistema per verificare gli ologrammi nei documenti d'identità usando gli smartphone.
― 7 leggere min
Questo studio combina telecamere RGB-D e IMU per una migliore stima del movimento.
― 6 leggere min
MovieChat semplifica la comprensione di video lunghi usando tecniche di gestione della memoria efficaci.
― 6 leggere min
Un nuovo metodo migliora il potere predittivo convertendo i dati tabulari in immagini.
― 7 leggere min
Un nuovo metodo semplifica la generazione di materiali per oggetti 3D usando richieste testuali.
― 8 leggere min
Un nuovo metodo identifica le discrepanze tra testo e immagini per combattere la disinformazione online.
― 6 leggere min
Un nuovo sistema migliora l'editing delle immagini usando istruzioni di testo semplici.
― 6 leggere min
Nuovo metodo migliora come le macchine navigano e comprendono i comandi in linguaggio.
― 7 leggere min
RSTAR-Net riduce gli artefatti a strisce nelle immagini del cancro ai polmoni, migliorando la precisione del trattamento.
― 6 leggere min
Un nuovo metodo migliora gli autoencoder per una migliore rappresentazione dei dati.
― 7 leggere min
Nuovo modello migliora il riconoscimento dell'ambiente del veicolo usando telecamere e LiDAR.
― 6 leggere min
Presentiamo il dataset ViOCRVQA per migliorare le risposte alle domande visive in vietnamita.
― 8 leggere min
Un nuovo metodo migliora la precisione nella misurazione dei livelli di ossigeno nel sangue usando l'imaging fotoacustico.
― 8 leggere min
Questo studio presenta un catalogo di oltre 211.000 galassie radio usando tecnologie avanzate.
― 6 leggere min
Uno sguardo all'equilibrio tra qualità del segnale e risoluzione spaziale nel LiDAR.
― 6 leggere min
Nuovi metodi migliorano la capacità dell'IA di rilevare immagini mediche inaspettate.
― 9 leggere min
Un nuovo metodo migliora il riconoscimento del testo scritto a mano in vari stili di scrittura.
― 5 leggere min
SMamba migliora la classificazione delle immagini iperspettrali grazie a meccanismi di scansione innovativi.
― 5 leggere min
IMEX-Reg migliora il machine learning riducendo il dimenticare e migliorando le prestazioni dei compiti.
― 9 leggere min
ShapeMoiré migliora la qualità delle immagini rimuovendo in modo efficace i fastidiosi pattern moiré.
― 5 leggere min
Nuovi metodi migliorano la trasformazione del testo in modelli 3D precisi.
― 5 leggere min
I modelli di deep learning migliorano l'accuratezza nella segmentazione degli ictus per ottenere risultati migliori per i pazienti.
― 9 leggere min
Esplorando l'importanza delle relazioni spaziali nelle interpretazioni della visione artificiale.
― 6 leggere min
Llip migliora il modo in cui le immagini vengono abbinate a diverse descrizioni testuali.
― 7 leggere min
Modifica immagini 3D con precisione usando vari metodi di input per cambiamenti locali.
― 6 leggere min
Esplorare il ruolo della tecnologia nel migliorare la diagnosi del cancro tramite l'analisi istologica.
― 7 leggere min
EMOPortraits migliora il realismo degli avatar animati rendendo più precisa l'espressione delle emozioni.
― 5 leggere min
Uno sguardo conciso sulle allucinazioni nei MLLM e strategie per migliorare l'affidabilità.
― 6 leggere min
Un nuovo metodo per modificare scene 3D più velocemente e con alta qualità usando descrizioni testuali.
― 7 leggere min
Un nuovo sistema migliora la qualità delle immagini usando adattatori specializzati basati su richieste testuali.
― 6 leggere min
TheaterGen combina modelli linguistici e visivi per racconti visivi coerenti.
― 8 leggere min
Un dataset completo di immagini di street view per progetti di geolocalizzazione in tutto il mondo.
― 7 leggere min
Esplorando le complessità nella gestione delle immagini mediche nella ricerca radiologica.
― 7 leggere min
I modelli quantistici migliorano l'accuratezza della classificazione delle immagini affrontando variazioni e rotazioni.
― 8 leggere min