Un nuovo metodo migliora il rilevamento delle emozioni nel parlato usando tecniche di self-attention.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo metodo migliora il rilevamento delle emozioni nel parlato usando tecniche di self-attention.
― 5 leggere min
Articoli più recenti
― 5 leggere min
― 7 leggere min
― 5 leggere min
― 5 leggere min
Articoli più recenti
Questo articolo parla di come il machine learning colma le lacune nell'audio vocale.
― 6 leggere min
Un nuovo modello migliora il rilevamento di clip audio false attraverso l'analisi stereo.
― 6 leggere min
Questo metodo aiuta le persone con problemi uditivi a individuare le fonti sonore nel loro ambiente.
― 6 leggere min
Esplora le ultime tecniche per migliorare la chiarezza del parlato in ambienti rumorosi.
― 6 leggere min
AudioSlots migliora la chiarezza del suono separando efficacemente le registrazioni audio miste.
― 5 leggere min
Un metodo per creare voci cantanti senza etichettatura vocale dettagliata.
― 7 leggere min
Un metodo migliora come gli assistenti vocali riconoscono parole poco comuni usando il contesto.
― 6 leggere min
Un nuovo framework migliora il doppiaggio catturando gli stili di parlato attraverso le lingue.
― 8 leggere min
Un modo nuovo per misurare il jitter usando l'analisi delle zero-crossing nell'attrezzatura audio.
― 7 leggere min
Un nuovo framework utilizza dati debolmente etichettati per una separazione audio efficace.
― 7 leggere min
CoMoSpeech migliora la velocità e la qualità della sintesi vocale con un processo in un solo passaggio.
― 4 leggere min
Nuovi benchmark migliorano i modelli di separazione audio per musica e intrattenimento.
― 5 leggere min
Nuovo metodo migliora i modelli di riconoscimento vocale riducendo la perdita di conoscenza.
― 4 leggere min
Esplorare le performance dell'ASR tra diversi accenti e le sue implicazioni.
― 6 leggere min
Un nuovo metodo per creare versioni musicali uniche riorganizzando pezzi già esistenti.
― 6 leggere min
Un nuovo sistema migliora la generazione del parlato con risultati di alta qualità.
― 7 leggere min
Un nuovo modello migliora l'accuratezza del riconoscimento vocale durante il discorso emotivo.
― 5 leggere min
Impara a usare bene FM e PM nel sound design.
― 6 leggere min
Un nuovo metodo migliora i compiti di riconoscimento vocale usando meno dati etichettati.
― 6 leggere min
Questo articolo esamina i recenti miglioramenti nella creazione di descrizioni audio scritte.
― 5 leggere min
Tecnologia di riconoscimento audio efficiente progettata per dispositivi TV a basso consumo.
― 5 leggere min
SCHmUBERT offre un approccio fresco per creare musica simbolica con l'IA.
― 6 leggere min
Un nuovo modello aumenta i punteggi di fiducia nei sistemi di riconoscimento vocale.
― 6 leggere min
Nuove tecniche migliorano la comprensione del linguaggio disartrico nei sistemi di comunicazione.
― 5 leggere min
Un nuovo approccio non supervisionato migliora l'isolamento della voce nei mix audio.
― 4 leggere min
Un nuovo benchmark per valutare i modelli di machine learning nella comprensione del parlato tra le lingue.
― 6 leggere min
Questo articolo parla di metodi per migliorare la classificazione dei telefoni usando le caratteristiche audio.
― 7 leggere min
Un nuovo modello migliora la percezione audio e le capacità di ragionamento nell'AI.
― 6 leggere min
NASS migliora l'isolamento vocale in ambienti rumorosi, superando i metodi tradizionali.
― 5 leggere min
Migliorare le metriche di qualità del suono usando nuovi metodi di calcolo del volume.
― 5 leggere min
AlignAtt migliora la traduzione del discorso simultanea con una velocità e una qualità superiori.
― 5 leggere min
Un nuovo metodo garantisce la privacy nella classificazione del linguaggio senza compromettere le prestazioni.
― 6 leggere min
Questo studio mostra come adattare la tecnologia TTS a diversi accenti in modo efficiente.
― 5 leggere min
Il modello AMII migliora la comunicazione per agenti socialmente interattivi attraverso un comportamento non verbale migliore.
― 6 leggere min
Presentiamo un modello che integra diversi tipi di dati per compiti complessi.
― 6 leggere min
I ricercatori stanno migliorando il modo in cui rileviamo automaticamente i suoni degli animali.
― 7 leggere min
Scopri come Whisper si adatta a diversi compiti di parola usando l'ingegneria dei prompt.
― 5 leggere min
FastFit migliora la velocità di generazione del parlato senza perdere qualità del suono.
― 5 leggere min
Un nuovo metodo migliora il rilevamento delle parole chiave nelle registrazioni audio.
― 5 leggere min
Il sistema AED-EEND migliora la diarizzazione degli speaker integrando tecniche avanzate per una precisione migliore.
― 5 leggere min