Nuovo framework migliora il riconoscimento vocale per i diversi dialetti arabi.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Nuovo framework migliora il riconoscimento vocale per i diversi dialetti arabi.
― 5 leggere min
Uno sguardo completo ai metodi di apprendimento auto-supervisionato nel riconoscimento del testo.
― 8 leggere min
Un nuovo metodo per valutare quanto bene si incastrano i pezzi audio nella musica.
― 5 leggere min
I robot possono imparare a regolare i loro movimenti in base a come afferrano gli oggetti.
― 6 leggere min
Il nuovo modello affronta il crollo delle caratteristiche nella patologia digitale usando la normalizzazione delle macchie.
― 9 leggere min
Una nuova tecnica migliora la previsione dell'età del cervello tramite metodi di apprendimento avanzati.
― 6 leggere min
Questo articolo esamina i progressi dell'AI oltre i transformer.
― 8 leggere min
Il modello DTS migliora l'accuratezza nella segmentazione delle immagini mediche per diagnosi migliori.
― 5 leggere min
Un nuovo approccio al clustering delle immagini usando l'apprendimento auto-supervisionato mostra risultati promettenti.
― 6 leggere min
Il modello TOGGL migliora l'accuratezza della trascrizione in situazioni di discorso sovrapposto.
― 5 leggere min
LiPCoT trasforma i dati delle serie temporali per le applicazioni dei modelli linguistici.
― 6 leggere min
Questo documento presenta l'Auto-supervisione Aggregata per migliorare l'apprendimento incrementale.
― 6 leggere min
PersonViT migliora l'identificazione individuale attraverso diversi flussi video usando tecniche innovative.
― 7 leggere min
Esplorare gli autoencoder mascherati e il loro impatto sull'analisi dei dati EEG.
― 6 leggere min
Snuffy offre una soluzione di machine learning per un'analisi WSI precisa.
― 5 leggere min
SPEED migliora il preprocessing dei dati EEG per ottenere risultati migliori nel machine learning.
― 5 leggere min
Un metodo per etichettare oggetti nelle immagini senza un addestramento dettagliato.
― 6 leggere min
MAT-SED usa un nuovo modello Transformer per una rilevazione efficace degli eventi sonori.
― 5 leggere min
Questo documento descrive un piano per l'integrazione dell'IA nella tecnologia satellitare.
― 5 leggere min
Un nuovo benchmark migliora la valutazione dei sistemi di riconoscimento delle emozioni nel parlato attraverso lingue ed emozioni.
― 6 leggere min
SSL-TTS semplifica la sintesi vocale usando pochi dati di addestramento per risultati di alta qualità.
― 6 leggere min
Un nuovo set di dati migliora le applicazioni di machine learning nell'imaging iperspettrale.
― 7 leggere min
Lo studio esplora metodi per la previsione del cancro usando dati etichettati e non etichettati.
― 9 leggere min
Un sistema innovativo automatizza la generazione di suoni per film e giochi.
― 8 leggere min
Un nuovo metodo migliora l'analisi degli alberi geometrici in vari settori.
― 6 leggere min
Nuovi metodi migliorano la segmentazione dei linfonodi usando annotazioni parziali.
― 8 leggere min
Scopri come l'AI sta trasformando la diagnosi nella patologìa computazionale usando modelli di base e modelli linguistico-visivi.
― 8 leggere min
NEST offre un approccio più veloce ed efficiente per i compiti di riconoscimento vocale self-supervised.
― 6 leggere min
O-HuBERT migliora il riconoscimento vocale separando il contenuto dalle informazioni espressive.
― 6 leggere min
Un nuovo modo per migliorare l'accuratezza del modello nonostante il rumore delle etichette.
― 5 leggere min
Un nuovo metodo migliora la comprensione delle immagini senza dati etichettati.
― 6 leggere min
Una panoramica sui progressi nel riconoscimento vocale grazie alla VoxCeleb Challenge.
― 5 leggere min
Esplorando l'impatto dell'apprendimento auto-supervisionato sull'analisi dei dati geospaziali.
― 6 leggere min
Questo articolo esamina come i modelli riconoscono il tono, l'accento e gli accenti di intonazione.
― 5 leggere min
Esaminare i pregiudizi nei modelli di base e il loro impatto sui risultati dell'imaging medico.
― 6 leggere min
Un nuovo metodo migliora le prestazioni del modello di linguaggio in vari compiti.
― 6 leggere min
Un nuovo modello migliora la generazione di serie temporali catturando caratteristiche dei dati semplici e complesse.
― 6 leggere min
Nuovo framework di intelligenza artificiale migliora la diagnosi di polmonite nei bambini usando dati limitati.
― 5 leggere min
Un nuovo metodo migliora l'identificazione degli autori nei documenti storici usando i Vision Transformers.
― 6 leggere min
La ricerca mette in evidenza metodi per migliorare l'apprendimento automatico nei veicoli autonomi usando dati video.
― 6 leggere min