Un nuovo metodo combina il riconoscimento vocale e l'identificazione del parlante per il discorso sovrapposto.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo metodo combina il riconoscimento vocale e l'identificazione del parlante per il discorso sovrapposto.
― 5 leggere min
Un nuovo metodo migliora la qualità e l'efficienza della traduzione in tempo reale.
― 5 leggere min
Un nuovo approccio migliora il machine learning con meno esempi e dati multimodali.
― 6 leggere min
Un nuovo metodo per stimare le risposte delle stanze in ambienti sonori complessi.
― 7 leggere min
Un nuovo metodo per la conversione della voce migliora la chiarezza e l'adattamento.
― 6 leggere min
Costruire sistemi TTS per lingue turche meno conosciute utilizzando dati kazaki.
― 5 leggere min
MeLoDy genera rapidamente musica di alta qualità da testi.
― 5 leggere min
Nuovi metodi emergono per proteggere il riconoscimento vocale dagli attacchi avversari.
― 5 leggere min
AudioDec offre audio di alta qualità in tempo reale con basso consumo di dati.
― 5 leggere min
Una nuova tecnica controlla l'esposizione ai dati di addestramento nei modelli di diffusione.
― 5 leggere min
Un nuovo modello migliora l'isolamento vocale in ambienti rumorosi.
― 5 leggere min
Questo articolo parla di come ricreare il suono delle cassette magnetiche usando la tecnologia digitale.
― 6 leggere min
Nuovo framework migliora la qualità della voce nella sintesi vocale.
― 5 leggere min
I ricercatori sviluppano tecnologia per ricreare voci uniche per chi ha problemi di parola.
― 6 leggere min
Un nuovo metodo migliora la verifica dell'identità del parlante combinando la distillazione della conoscenza e il fine-tuning.
― 7 leggere min
DeCoR aiuta le macchine a imparare suoni nuovi senza dimenticare quelli vecchi.
― 5 leggere min
I trasformatori audio in streaming migliorano la velocità e l'efficienza nei sistemi di tagging audio.
― 6 leggere min
Nuove tecniche migliorano l'accuratezza e la velocità nella conversione della voce in testo.
― 6 leggere min
Questa ricerca presenta valutazioni migliorate per una comunicazione più chiara nelle persone con disartria.
― 6 leggere min
Un nuovo metodo migliora il riconoscimento vocale per nomi che suonano simili.
― 6 leggere min
Un nuovo metodo migliora la naturalezza e la varietà dell'output da testo a parlato.
― 6 leggere min
L'adattatore Treff migliora la classificazione audio con pochi dati etichettati.
― 5 leggere min
Nuovi metodi migliorano la flessibilità e le prestazioni del modello nei compiti audio.
― 4 leggere min
La ricerca mette in evidenza metodi efficaci per riconoscere le emozioni nel parlato usando gli embedding.
― 6 leggere min
Scopri come gli E-PANN migliorano l'efficienza nel riconoscimento dei suoni.
― 5 leggere min
Questa ricerca analizza i dialetti usando registrazioni audio per rivelare le loro somiglianze.
― 6 leggere min
Nuovo metodo migliora la comprensione del linguaggio parlato senza bisogno di trascrizioni scritte.
― 6 leggere min
Un nuovo metodo migliora la classificazione audio imparando nuovi suoni in modo efficiente.
― 4 leggere min
Nuovo metodo migliora l'adattamento TTS con minime esigenze di dati.
― 6 leggere min
Una panoramica dei metodi di AI spiegabile nel riconoscimento vocale automatico.
― 6 leggere min
Un nuovo modello migliora come le macchine capiscono e rispondono a domande audio.
― 6 leggere min
La ricerca sottolinea l'importanza di migliorare il turn-taking nella tecnologia TTS.
― 6 leggere min
BabySLM valuta quanto bene le macchine imparano a capire il linguaggio basato sulle parole dei bambini.
― 7 leggere min
Un nuovo metodo migliora la selezione della voce sintetica per aumentare l'accuratezza dei sistemi ASR.
― 6 leggere min
Un nuovo metodo allinea il parlato disfluente con il testo in modo efficiente.
― 6 leggere min
Migliorare i sistemi per il riconoscimento vocale silenzioso con nuove tecniche.
― 5 leggere min
Nuovi metodi migliorano il riconoscimento vocale automatico per parole rare usando il contesto.
― 6 leggere min
Un nuovo metodo per addestrare modelli di riconoscimento parole chiave usando supervisione debole in ambienti rumorosi.
― 7 leggere min
Metodi per migliorare i sistemi di traduzione del parlato per lingue sottorappresentate.
― 5 leggere min
MERT affronta le sfide della modellazione musicale attraverso tecniche innovative di apprendimento auto-supervisionato.
― 6 leggere min