Indagare le vulnerabilità nei metodi di watermarking audio contro minacce reali.
― 8 leggere min
Scienza all'avanguardia spiegata semplicemente
Indagare le vulnerabilità nei metodi di watermarking audio contro minacce reali.
― 8 leggere min
PianoMotion10M offre movimenti delle mani dettagliati per aiutare chi impara a suonare il pianoforte.
― 6 leggere min
Un nuovo modello migliora il match del suono con le azioni visive nei video.
― 11 leggere min
Il nuovo modello migliora le esperienze audio realistiche negli ambienti virtuali.
― 7 leggere min
Questo studio esamina i metodi audio per tracciare i movimenti dei pedoni nelle aree urbane.
― 7 leggere min
Un nuovo dataset migliora la creazione di audio foley per contenuti multimediali.
― 6 leggere min
Nuovi metodi migliorano il riconoscimento vocale in ambienti rumorosi usando tecniche adattive.
― 7 leggere min
SPEAR prevede il comportamento sonoro in spazi 3D usando una raccolta di dati minimale.
― 6 leggere min
Un nuovo metodo migliora la traduzione del parlato in lingue miste in inglese.
― 5 leggere min
Un nuovo metodo migliora l'accuratezza della verifica dell'oratore in ambienti radio difficili.
― 7 leggere min
Nuovo metodo punta sui cambiamenti di ritmo per attacchi vocali furtivi.
― 6 leggere min
GAMA migliora l'elaborazione audio unendo intuizioni su suono e linguaggio.
― 6 leggere min
Un nuovo sistema aiuta a separare il parlato dal rumore per una comunicazione più chiara.
― 7 leggere min
GigaSpeech 2 offre un'enorme raccolta di dati per le lingue a bassa risorsa per migliorare il riconoscimento vocale.
― 5 leggere min
Un nuovo modello migliora la tecnologia da testo a voce con efficienza e adattabilità.
― 6 leggere min
Un nuovo metodo per ottimizzare l'analisi e la sintesi del parlato usando i movimenti del tratto vocale.
― 7 leggere min
Questo studio esamina come i gesti influenzano l'apprendimento dagli agenti virtuali.
― 7 leggere min
DExter usa l'IA per creare musica per pianoforte espressiva da spartiti scritti.
― 6 leggere min
Scopri la diarizzazione degli speaker online e il suo significato in diverse applicazioni.
― 7 leggere min
Nuovo strumento di benchmark valuta i token audio discreti per vari compiti di elaborazione del parlato.
― 9 leggere min
Un nuovo metodo per la generazione di musica usando matrici di autosimilarità e sistemi di attenzione.
― 7 leggere min
Nuove tecniche migliorano la modellazione degli amplificatori per chitarra usando dati non abbinati e GAN.
― 7 leggere min
Un nuovo metodo migliora la conversione vocale tra lingue mantenendo i tratti del parlante.
― 4 leggere min
Un nuovo metodo per capire come i modelli audio fanno previsioni.
― 5 leggere min
Introduzione della conversione vocale spaziale per migliorare il realismo audio e l'immersione.
― 6 leggere min
WavRx analizza il linguaggio per la salute proteggendo la privacy, mostrando risultati diagnostici promettenti.
― 8 leggere min
La ricerca esplora come l'analisi del linguaggio possa prevedere il rischio di suicidio, tenendo conto delle differenze di genere.
― 5 leggere min
Questo documento presenta un sistema per creare immagini che rispondono alla musica.
― 7 leggere min
Un nuovo sistema aiuta i robot ad apprendere compiti utilizzando audio da dimostrazioni reali.
― 7 leggere min
Nuovi metodi migliorano l'accuratezza nel riconoscere suoni sovrapposti da diverse sorgenti audio.
― 6 leggere min
Un nuovo metodo combina caratteristiche acustiche e punteggi di fiducia per una correzione degli errori migliore.
― 5 leggere min
SecureSpectra offre un modo nuovo per proteggere l'identità audio dai rischi dei deepfake.
― 6 leggere min
Combinare fisica e geometria per migliorare le previsioni di scattering acustico.
― 5 leggere min
Un nuovo sistema per la traduzione rapida e precisa del parlato in diverse lingue.
― 6 leggere min
Un metodo semplice per creare voci e controllare le emozioni nella sintesi vocale.
― 5 leggere min
Migliorare MMDenseNet per una separazione musicale veloce ed efficiente.
― 5 leggere min
Un approccio innovativo per migliorare la chiarezza del suono usando tecniche avanzate di deep learning.
― 7 leggere min
Un sistema combina audio e video per migliorare l'accuratezza del riconoscimento degli speaker.
― 5 leggere min
Un nuovo metodo migliora il dialogo macchina grazie a dati pseudo-stereo.
― 7 leggere min
Questo studio presenta un dataset e un metodo per migliorare l'accuratezza dell'ASR cinese usando il Pinyin.
― 7 leggere min