Il nuovo modello ZET-Speech migliora la sintesi vocale emozionale per diversi speaker.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Il nuovo modello ZET-Speech migliora la sintesi vocale emozionale per diversi speaker.
― 5 leggere min
Uno studio trova che nuove tecniche di missaggio migliorano l'accuratezza della trascrizione musicale.
― 4 leggere min
Un nuovo metodo migliora le risposte delle macchine attraverso una migliore comprensione emotiva.
― 6 leggere min
Un nuovo metodo migliora l'accuratezza nel riconoscimento vocale automatico per le riunioni.
― 6 leggere min
CALLS punta a migliorare la capacità degli assistenti vocali di gestire le interazioni con i clienti.
― 5 leggere min
Nuovi metodi migliorano il restauro audio e la qualità di produzione.
― 5 leggere min
La ricerca migliora le tecniche di quantizzazione per aumentare l'efficienza dei modelli di riconoscimento vocale.
― 8 leggere min
PLCMOS offre un nuovo modo per valutare la qualità del suono senza ascoltatori umani.
― 6 leggere min
LoopBoxes aiuta i bambini a creare musica in modo semplice e collaborativo.
― 6 leggere min
Un nuovo metodo per creare suoni d'impatto realistici tramite reti neurali.
― 5 leggere min
Una nuova tecnica migliora i sistemi ASR per riconoscere meglio gli accenti non nativi.
― 6 leggere min
Nuovi metodi sfruttano l'identità del parlante per migliorare le prestazioni del riconoscimento vocale.
― 5 leggere min
Un nuovo metodo combina il riconoscimento vocale e l'identificazione del parlante per il discorso sovrapposto.
― 5 leggere min
Un nuovo metodo migliora la qualità e l'efficienza della traduzione in tempo reale.
― 5 leggere min
Un nuovo approccio migliora il machine learning con meno esempi e dati multimodali.
― 6 leggere min
Un nuovo metodo per stimare le risposte delle stanze in ambienti sonori complessi.
― 7 leggere min
Un nuovo metodo per la conversione della voce migliora la chiarezza e l'adattamento.
― 6 leggere min
Costruire sistemi TTS per lingue turche meno conosciute utilizzando dati kazaki.
― 5 leggere min
MeLoDy genera rapidamente musica di alta qualità da testi.
― 5 leggere min
Nuovi metodi emergono per proteggere il riconoscimento vocale dagli attacchi avversari.
― 5 leggere min
AudioDec offre audio di alta qualità in tempo reale con basso consumo di dati.
― 5 leggere min
Una nuova tecnica controlla l'esposizione ai dati di addestramento nei modelli di diffusione.
― 5 leggere min
Un nuovo modello migliora l'isolamento vocale in ambienti rumorosi.
― 5 leggere min
Questo articolo parla di come ricreare il suono delle cassette magnetiche usando la tecnologia digitale.
― 6 leggere min
Nuovo framework migliora la qualità della voce nella sintesi vocale.
― 5 leggere min
I ricercatori sviluppano tecnologia per ricreare voci uniche per chi ha problemi di parola.
― 6 leggere min
Un nuovo metodo migliora la verifica dell'identità del parlante combinando la distillazione della conoscenza e il fine-tuning.
― 7 leggere min
DeCoR aiuta le macchine a imparare suoni nuovi senza dimenticare quelli vecchi.
― 5 leggere min
I trasformatori audio in streaming migliorano la velocità e l'efficienza nei sistemi di tagging audio.
― 6 leggere min
Nuove tecniche migliorano l'accuratezza e la velocità nella conversione della voce in testo.
― 6 leggere min
Questa ricerca presenta valutazioni migliorate per una comunicazione più chiara nelle persone con disartria.
― 6 leggere min
Un nuovo metodo migliora il riconoscimento vocale per nomi che suonano simili.
― 6 leggere min
Un nuovo metodo migliora la naturalezza e la varietà dell'output da testo a parlato.
― 6 leggere min
L'adattatore Treff migliora la classificazione audio con pochi dati etichettati.
― 5 leggere min
Nuovi metodi migliorano la flessibilità e le prestazioni del modello nei compiti audio.
― 4 leggere min
La ricerca mette in evidenza metodi efficaci per riconoscere le emozioni nel parlato usando gli embedding.
― 6 leggere min
Scopri come gli E-PANN migliorano l'efficienza nel riconoscimento dei suoni.
― 5 leggere min
Questa ricerca analizza i dialetti usando registrazioni audio per rivelare le loro somiglianze.
― 6 leggere min
Nuovo metodo migliora la comprensione del linguaggio parlato senza bisogno di trascrizioni scritte.
― 6 leggere min
Un nuovo metodo migliora la classificazione audio imparando nuovi suoni in modo efficiente.
― 4 leggere min