Un nuovo metodo ottimizza i modelli vocali per migliori prestazioni con meno risorse.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo metodo ottimizza i modelli vocali per migliori prestazioni con meno risorse.
― 5 leggere min
Un approccio nuovo migliora il modo in cui valutiamo la qualità dell'audio spaziale.
― 5 leggere min
Uno studio su come distinguere tra discorso letto e discorso spontaneo.
― 6 leggere min
Un nuovo modello migliora il realismo del parlato sintetico.
― 8 leggere min
Malafide introduce tecniche di spoofing sofisticate, complicando le contromisure nel riconoscimento vocale.
― 6 leggere min
Un nuovo modello migliora l'accuratezza e l'efficienza nel tracciare le fonti sonore.
― 5 leggere min
Un nuovo dataset migliora la comprensione del linguaggio parlato per l'italiano.
― 6 leggere min
MCR-Data2vec 2.0 migliora il riconoscimento vocale rendendo il modello più consistente.
― 4 leggere min
EM-Network migliora l'apprendimento delle sequenze nei compiti di elaborazione del parlato e del linguaggio.
― 5 leggere min
Nuovi metodi migliorano il riconoscimento vocale multilingue usando fonti di dati esistenti.
― 6 leggere min
La ricerca si concentra sul miglioramento della tecnologia vocale per lingue che non hanno abbastanza dati.
― 6 leggere min
Uno sguardo ai recenti sviluppi per migliorare la chiarezza audio usando modelli avanzati.
― 5 leggere min
Un nuovo set di dati punta a classificare i punteggi del pianoforte per livello di difficoltà.
― 7 leggere min
Il framework Gesper migliora la chiarezza del parlato in ambienti rumorosi.
― 5 leggere min
Questo studio presenta un nuovo metodo per migliorare la qualità del parlato usando modelli già addestrati.
― 6 leggere min
Combinare audio, video e testo migliora il rilevamento dell'odio.
― 6 leggere min
Questo articolo parla di un nuovo metodo per costruire sistemi ASR efficienti.
― 5 leggere min
Un nuovo approccio migliora il riconoscimento vocale direttamente sugli smartphone, garantendo la privacy dell'utente.
― 6 leggere min
Un nuovo metodo migliora l'accuratezza nell'identificare i relatori durante le conversazioni.
― 5 leggere min
I team migliorano l'identificazione dei suoni degli animali con pochi esempi nella sfida DCASE.
― 6 leggere min
Scopri i sistemi di tagging audio e il loro utilizzo su Raspberry Pi.
― 5 leggere min
Nuove tecniche migliorano la precisione e l'efficienza nell'identificare le cover.
― 5 leggere min
Nuovo metodo migliora il controllo del rumore negli spazi 3D.
― 4 leggere min
CML-TTS permette di avere sistemi di sintesi vocale migliori in sette lingue.
― 5 leggere min
Questo studio valuta vari modelli per prevedere la qualità del parlato sintetizzato.
― 6 leggere min
I ricercatori automatizzano la classificazione dei suoni degli uccelli, migliorando l'accuratezza nel monitoraggio delle specie.
― 5 leggere min
FALL-E crea effetti sonori di alta qualità a partire da descrizioni testuali.
― 5 leggere min
Un nuovo metodo migliora la conversione vocale per le persone con linguaggio atipico.
― 5 leggere min
SURT 2.0 migliora il riconoscimento vocale per più parlanti in situazioni in tempo reale.
― 6 leggere min
MARBLE stabilisce uno standard per valutare i modelli di intelligenza artificiale musicale su più attività.
― 7 leggere min
Un nuovo metodo migliora l'accuratezza nell'identificare i canti degli uccelli.
― 6 leggere min
Nuovi algoritmi migliorano le prestazioni di elaborazione audio su diverse frequenze di campionamento.
― 5 leggere min
La ricerca esplora l'analisi sonora per migliorare la selezione delle zanzare per il controllo delle malattie.
― 5 leggere min
Esplora due metodi innovativi per modificare il timbro vocale usando il Digital Signal Processing.
― 4 leggere min
Un nuovo metodo migliora la tecnologia di riconoscimento vocale senza perdere le conoscenze apprese in precedenza.
― 6 leggere min
Un nuovo modello migliora l'accuratezza della trascrizione musicale per più strumenti.
― 6 leggere min
Un nuovo metodo combina apprendimento tradizionale e profondo per un'imaging del suono efficiente.
― 6 leggere min
Nuovi metodi migliorano il realismo nelle tecnologie audio usando tecniche informate dalla fisica.
― 6 leggere min
Un nuovo modello migliora l'apprendimento delle parole usando audio e immagini.
― 6 leggere min
Indagando su come la tecnologia vocale può prevenire la partecipazione duplicata dei pazienti negli studi clinici.
― 7 leggere min