MACE migliora la didascalia audio collegando i suoni a descrizioni testuali accurate.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
MACE migliora la didascalia audio collegando i suoni a descrizioni testuali accurate.
― 5 leggere min
Usare il machine learning per prevedere la reazione del pubblico ai cover delle canzoni.
― 7 leggere min
Un nuovo modo per migliorare la classificazione attraverso la Distribuzione della Distanza Angolare.
― 6 leggere min
Nuovi metodi migliorano gli strumenti di comunicazione per le persone con difficoltà nel parlare.
― 7 leggere min
Nuovi metodi che usano modelli di linguaggio migliorano il riconoscimento dei suoni in mezzo al rumore di fondo.
― 6 leggere min
Fish-Speech migliora la tecnologia vocale per un'esperienza di comunicazione più naturale.
― 6 leggere min
EmoSphere++ permette alle macchine di esprimere emozioni come gli esseri umani, migliorando le interazioni.
― 7 leggere min
U-COTANS migliora il rilevamento dei confini subacquei usando tecniche di deep learning.
― 6 leggere min
PIAST offre una collezione unica di musica per pianoforte per i ricercatori.
― 5 leggere min
Le macchine imparano a collegare suoni e immagini in spazi 3D.
― 7 leggere min
Come i nuovi metodi stanno trasformando l'identificazione degli oratori nelle registrazioni audio.
― 6 leggere min
I ricercatori usano la tecnologia per visualizzare i movimenti della lingua durante il parlare.
― 8 leggere min
Scopri come Align-SLM sta rivoluzionando la generazione di discorsi al computer.
― 6 leggere min
Scopri come TSE migliora il riconoscimento vocale in ambienti affollati usando indizi testuali.
― 6 leggere min
Un nuovo sistema rileva le urla per migliorare la sicurezza dei lavoratori nei cantieri.
― 8 leggere min
Esplorare nuovi metodi per riconoscere le emozioni nel parlato usando modelli avanzati.
― 8 leggere min
Un nuovo approccio migliora la valutazione della qualità del parlato tenendo conto del rumore di fondo.
― 6 leggere min
Un sistema nuovo per unire campioni audio e aiutare i creatori di musica a innovare facilmente.
― 5 leggere min
Uno sguardo a come la compressione della gamma dinamica migliora le esperienze audio.
― 6 leggere min
Gli assistenti vocali aiutano a identificare i primi segnali di problemi di memoria negli anziani.
― 7 leggere min
Un sistema crea musica in tempo reale basata sulle narrazioni dei giochi di ruolo da tavolo.
― 7 leggere min
Esaminando i punti di forza, le debolezze e il futuro dello SLAM-ASR nel riconoscimento vocale.
― 5 leggere min
Un nuovo metodo per chiarire e visualizzare le immagini del campo sonoro.
― 7 leggere min
Un progetto migliora il riconoscimento vocale per la lingua Malasar usando risorse in Tamil.
― 5 leggere min
I ricercatori studiano il linguaggio per migliorare le valutazioni della salute mentale per la schizofrenia.
― 8 leggere min
Scopri come i musicisti sincronizzano il loro tempo con i modelli scientifici.
― 5 leggere min
NeKo migliora la comunicazione tra macchine sistemando errori di linguaggio, traduzioni e testi.
― 7 leggere min
Scopri come il suono migliora le esperienze virtuali attraverso il rendering acustico.
― 8 leggere min
Questo studio usa l'analisi del suono per identificare i guasti delle macchine in modo efficace.
― 5 leggere min
Debatts aiuta gli utenti a creare controargomentazioni efficaci per i dibattiti.
― 6 leggere min
Un nuovo modello migliora l'identificazione e la localizzazione dei suoni in modo efficace.
― 7 leggere min
AuscultaBase migliora l'accuratezza nella diagnosi di condizioni di salute utilizzando diversi dati sui suoni del corpo.
― 4 leggere min
Un nuovo set di dati aiuta a trovare musica attraverso un dialogo amichevole.
― 7 leggere min
Combinare registrazioni audio con spartiti per praticare meglio.
― 6 leggere min
AEROMamba migliora l'audio di bassa qualità trasformandolo in un suono ricco e ad alta fedeltà.
― 5 leggere min
Un modello audio-linguistico innovativo aiuta a studiare i suoni e i comportamenti degli animali.
― 7 leggere min
Creare un modello di intelligenza artificiale per conversazioni naturali in mandarino taiwanese.
― 5 leggere min
Mamba migliora il riconoscimento vocale con velocità e precisione, cambiando il modo di interagire con i dispositivi.
― 4 leggere min
Un nuovo metodo migliora la chiarezza del parlato usando informazioni visive dall'ambiente circostante.
― 5 leggere min
Uno sguardo a come si comporta il suono in ambienti dinamici.
― 5 leggere min