I ricercatori stanno sviluppando dati vocali sintetici per proteggere la privacy nel riconoscimento vocale.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
I ricercatori stanno sviluppando dati vocali sintetici per proteggere la privacy nel riconoscimento vocale.
― 5 leggere min
VoxtLM combina riconoscimento vocale, sintesi, generazione di testo e continuazione in un unico modello.
― 4 leggere min
Nuovo sistema migliora il riconoscimento vocale usando richieste consapevoli del contesto.
― 4 leggere min
EnCodecMAE combina l'apprendimento auto-supervisionato e i codec audio per migliorare le performance nei compiti audio.
― 5 leggere min
Uno studio sull'uso del machine learning per identificare i suoni dei bambini per la valutazione dell'ASD.
― 5 leggere min
Presentando un metodo flessibile per riconoscere le parole chiave nel parlato in diverse lingue.
― 6 leggere min
Uno sguardo a come si testa la qualità dell'audio usando il crowdsourcing.
― 5 leggere min
Un nuovo metodo allena sistemi di didascalia audio usando solo descrizioni testuali.
― 6 leggere min
Una guida per scrivere articoli accademici chiari ed efficaci.
― 3 leggere min
Esaminando i rischi degli attacchi backdoor sui sistemi di verifica vocale.
― 7 leggere min
Un nuovo metodo migliora la segmentazione audio-visiva senza etichette dettagliate.
― 6 leggere min
PIAVE aiuta le macchine a estrarre le voci in modo chiaro, anche quando i parlanti girano la testa.
― 6 leggere min
Libriheavy offre 50.000 ore di inglese parlato per potenziare la tecnologia di riconoscimento vocale.
― 5 leggere min
AV2Wav migliora la qualità del parlato usando segnali audio e visivi.
― 5 leggere min
Un metodo nuovo per far sì che le macchine cambino le emozioni del discorso in modo naturale.
― 5 leggere min
Si stanno sviluppando nuovi metodi per identificare le voci cantanti deepfake nell'industria musicale.
― 6 leggere min
La selezione di core-set migliora i modelli di sintesi vocale concentrandosi su dati diversi.
― 6 leggere min
Nuovi modelli stanno cambiando il modo in cui analizziamo le emozioni nel parlato.
― 6 leggere min
Un nuovo metodo usa l'ultrasuono per riconoscere le azioni garantendo la privacy.
― 5 leggere min
Introducendo un framework flessibile per migliorare la ricerca sulla privacy vocale.
― 7 leggere min
CiwaGAN unisce il controllo dei movimenti del parlato e la condivisione delle informazioni per migliorare l'apprendimento del linguaggio.
― 6 leggere min
Un sistema che combina segnali verbali e non verbali per migliorare l'apprendimento delle lingue.
― 6 leggere min
Un nuovo metodo semplifica la comprensione dei modelli di classificazione del parlato.
― 6 leggere min
Un nuovo sistema migliora le abilità di pronuncia tenendo conto delle influenze della lingua madre.
― 6 leggere min
Scopri come gli strumenti quantistici cambiano la creazione e la performance musicale.
― 6 leggere min
Un nuovo metodo migliora la preservazione delle emozioni nei processi di conversione vocale.
― 6 leggere min
Nuovo metodo conserva il tono emotivo nella conversione della voce per una migliore interazione uomo-computer.
― 6 leggere min
Nuovi sistemi migliorano la traduzione da testo a linguaggio parlato senza intermediari.
― 5 leggere min
I ricercatori migliorano l'accuratezza nella classificazione dei suoni cardiaci usando metodi di aumento dei dati con codec.
― 6 leggere min
Le ricerche mostrano che il discorso emotivo influisce sulle performance dei modelli nei compiti di separazione del parlato.
― 7 leggere min
M-AUDIODEC comprime l'audio multicanale mantenendo la posizione degli altoparlanti e la qualità.
― 6 leggere min
Nuovi metodi in S2ST migliorano la qualità della traduzione mantenendo l'identità del parlante.
― 6 leggere min
Un nuovo sistema migliora la compressione audio spaziale per un suono più chiaro e un'efficienza maggiore.
― 5 leggere min
Un nuovo sistema che collega musica e lingua per una comprensione migliore.
― 6 leggere min
La ricerca svela nuovi modelli per migliorare la chiarezza della voce negli auricolari smart.
― 5 leggere min
Usare informazioni extra ci aiuta a riconoscere i canti degli uccelli.
― 6 leggere min
Un nuovo approccio migliora la generazione audio allineando l'audio con le descrizioni testuali.
― 5 leggere min
I ricercatori lavorano per migliorare il riconoscimento vocale online usando modelli di spazio degli stati strutturati.
― 5 leggere min
Un nuovo sistema migliora le esperienze delle riunioni identificando i relatori in tempo reale.
― 4 leggere min
Nuovi metodi stanno migliorando la nostra capacità di rilevare il discorso falso in modo efficace.
― 6 leggere min