Indagando su come la tecnologia vocale può prevenire la partecipazione duplicata dei pazienti negli studi clinici.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
Indagando su come la tecnologia vocale può prevenire la partecipazione duplicata dei pazienti negli studi clinici.
― 7 leggere min
Un nuovo dataset aiuta a identificare segni di depressione e ansia attraverso l'analisi del parlato.
― 7 leggere min
Nuovo metodo ricostruisce il suono dai segnali cerebrali, rivelando intuizioni sul processamento uditivo.
― 5 leggere min
Una guida per usare modelli AI per la musica sulla piattaforma Bela.
― 5 leggere min
Un nuovo metodo valuta i sistemi ASR senza bisogno di testi di riferimento.
― 5 leggere min
NoRefER offre un modo nuovo per valutare i risultati del riconoscimento vocale senza bisogno di trascrizioni.
― 6 leggere min
Quest'articolo parla di un metodo per migliorare i sottotitoli dei video incorporando l'audio.
― 6 leggere min
Un nuovo modello migliora la conversione vocale semplificando le tecniche di separazione del parlato.
― 7 leggere min
La ricerca punta a combinare dati audio e simbolici per analizzare la somiglianza musicale.
― 7 leggere min
Nuovi metodi migliorano la segmentazione del parlato nelle conversazioni multilingue.
― 6 leggere min
NoisyILRMA migliora l'estrazione del suono dal rumore di fondo per un'esperienza audio più chiara.
― 4 leggere min
Questo articolo parla del ruolo dell'apprendimento auto-supervisionato nella tecnologia musicale.
― 6 leggere min
Un nuovo framework migliora l'ASR per le lingue a risorse limitate e la scalabilità multilingue.
― 6 leggere min
I sistemi ASR personalizzati migliorano notevolmente la comunicazione per le persone DHH.
― 6 leggere min
Nuovi metodi sfruttano i riassunti conversazionali per un riconoscimento degli speaker migliore.
― 6 leggere min
Migliorare i sistemi di feedback per gli studenti di inglese affrontando il problema del cold start.
― 6 leggere min
Ricercando metodi per localizzare le fonti sonore delle turbine eoliche per ridurre il rumore.
― 5 leggere min
Introduzione di un nuovo modello per identificare le tecniche vocali nei brani audio.
― 6 leggere min
Un nuovo modello migliora l'estrazione del parlato usando informazioni audio e visive.
― 6 leggere min
Wespeaker semplifica il riconoscimento degli speaker con strumenti facili da usare e modelli già pronti.
― 6 leggere min
Un nuovo metodo trasforma i segnali mono in esperienze stereo coinvolgenti.
― 6 leggere min
Uno studio per migliorare il riconoscimento delle emozioni nel parlare per gruppi diversi.
― 5 leggere min
Questo articolo parla di come migliorare il riconoscimento vocale usando metodi di ensemble basati sulla fiducia.
― 5 leggere min
Lo studio usa un dispositivo multi-dati per monitorare i modelli di sonno dei neonati in modo più preciso.
― 5 leggere min
3D-Speaker offre una vasta collezione di registrazioni audio per un'analisi del parlato avanzata.
― 5 leggere min
GenerTTS migliora la tecnologia di sintesi vocale per applicazioni multilingue.
― 5 leggere min
Un nuovo sistema migliora il rilevamento di audio manipolato attraverso tecniche innovative.
― 5 leggere min
Migliorare il riconoscimento vocale per voci sovrapposte rende tutto più facile in tanti contesti.
― 5 leggere min
Nuovi metodi migliorano la separazione della voce in ambienti audio misti.
― 5 leggere min
Scopri come le nuove tecniche migliorano la chiarezza del parlato in ambienti rumorosi.
― 5 leggere min
Un nuovo metodo per rendere la sintesi vocale più personale usando meno dati vocali.
― 5 leggere min
Nuovi metodi migliorano la localizzazione del suono utilizzando array di microfoni distribuiti.
― 5 leggere min
Questo studio esamina metodi per proteggere la privacy mentre si analizzano conversazioni parlate.
― 6 leggere min
Attacchi recenti tramite backdoor mettono in luce i rischi nelle tecnologie di identificazione vocale.
― 7 leggere min
Un nuovo modello migliora l'estrazione del parlato da sfondi rumorosi usando il deep learning.
― 5 leggere min
GOLF offre un modo nuovo per creare canti simili a quelli umani usando meno risorse.
― 6 leggere min
Ricerca su come prevedere età e genere dai dati vocali utilizzando modelli innovativi.
― 5 leggere min
Un metodo nuovo per capire le relazioni musicali tramite alberi di dipendenza.
― 6 leggere min
Questo articolo parla di nuovi modelli che migliorano l'accuratezza del riconoscimento vocale tenendo conto di un contesto più lungo.
― 6 leggere min
LyricWhiz combina modelli avanzati per migliorare l'accuratezza della trascrizione dei testi in diverse lingue.
― 6 leggere min