Nuovi metodi mirano a proteggere la privacy del parlato nei sistemi di monitoraggio audio.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Nuovi metodi mirano a proteggere la privacy del parlato nei sistemi di monitoraggio audio.
― 5 leggere min
Un metodo che usa audio e video per migliorare la rilevazione dei deepfake.
― 4 leggere min
Un nuovo modello di intelligenza artificiale migliora la previsione dei punteggi di qualità audio.
― 6 leggere min
La ricerca esplora il deep learning per creare audio che si abbini al contenuto video muto.
― 7 leggere min
Un nuovo metodo migliora le registrazioni audio usando indizi visivi.
― 6 leggere min
Esplorare l'impatto dei contenuti generati dall'IA sull'arte del raccontare storie.
― 7 leggere min
Un nuovo sistema migliora le registrazioni audio per esperienze di ascolto migliori.
― 6 leggere min
Questo studio esamina le difficoltà nell'usare l'apprendimento contrastivo per comprendere i video musicali.
― 6 leggere min
Un approccio unificato per valutare l'alimentazione dei pesci usando dati audio e video.
― 5 leggere min
Questo articolo esplora i progressi nella diarizzazione degli speaker utilizzando modelli di linguaggio per una maggiore precisione.
― 5 leggere min
I ricercatori stanno esplorando la tecnologia di rilevamento audio per migliorare il riconoscimento dei pedoni nelle aree urbane.
― 6 leggere min
Tecniche avanzate per garantire l'autenticità audio nell'era del cloning vocale.
― 5 leggere min
Un nuovo approccio migliora la generazione audio allineando l'audio con le descrizioni testuali.
― 5 leggere min
Nuovi metodi stanno migliorando la nostra capacità di rilevare il discorso falso in modo efficace.
― 6 leggere min
Nuovi metodi migliorano le prestazioni del vocoder con dati audio limitati.
― 5 leggere min
Questo studio esplora strategie di allenamento per migliorare la rilevazione di audio falsi.
― 5 leggere min
Un metodo solido per identificare anomalie audio e combattere il voice spoofing.
― 5 leggere min
Nuovi metodi combinano audio e metadati per un riconoscimento linguistico migliore.
― 5 leggere min
Un nuovo metodo migliora la generazione musicale aggiungendo il contesto della performance.
― 6 leggere min
Un nuovo approccio sfrutta l'apprendimento auto-supervisionato per collegare audio e spartiti.
― 5 leggere min
Un nuovo metodo migliora il matching tra audio e spartiti.
― 6 leggere min
Un nuovo metodo per aggiungere filigrane all'audio creato da modelli di diffusione per proteggere la proprietà.
― 6 leggere min
AVI-Talking crea facce 3D realistiche che esprimono emozioni attraverso l'audio.
― 6 leggere min
Combinare audio, video e testo per valutazioni della salute mentale migliori.
― 6 leggere min
Nuovi metodi migliorano il realismo nei umani digitali e avatar.
― 4 leggere min
Nuovo metodo migliora la verifica dell'identità degli speaker unendo dati audio e visivi.
― 5 leggere min
Un nuovo modello identifica i momenti divertenti nei video usando dati visivi, audio e di testo.
― 6 leggere min
CoAVT integra dati audio, visivi e testuali per una comprensione migliore.
― 8 leggere min
Audio Flamingo è super nel ascoltare, chiacchierare e adattarsi a nuove task audio.
― 6 leggere min
Un nuovo modello genera movimenti realistici nelle conversazioni, migliorando la comprensione dell'interazione.
― 5 leggere min
Un nuovo modello migliora il rilevamento delle interruzioni del dialogo per i sistemi di intelligenza artificiale.
― 8 leggere min
Un nuovo metodo per creare e modificare immagini usando segnali audio.
― 7 leggere min
CLaM-TTS migliora la sintesi vocale usando tecniche avanzate per una resa migliore e più efficiente.
― 6 leggere min
CoCoGesture crea gesti realistici che si abbinano alle parole pronunciate, migliorando l'interazione.
― 5 leggere min
Un nuovo framework trasforma i segnali MEG in testo significativo, aiutando la tecnologia di comunicazione.
― 10 leggere min
Un nuovo approccio alla captioning audio riduce la dipendenza dai dati abbinati.
― 6 leggere min
Questo studio esamina i metodi audio per tracciare i movimenti dei pedoni nelle aree urbane.
― 7 leggere min
Un nuovo sistema aiuta a separare il parlato dal rumore per una comunicazione più chiara.
― 7 leggere min
Un nuovo sistema aiuta i robot ad apprendere compiti utilizzando audio da dimostrazioni reali.
― 7 leggere min
Uno studio sull'uso di dati testuali e audio per migliorare il riconoscimento delle emozioni.
― 6 leggere min