Un nuovo sistema aiuta i robot ad apprendere compiti utilizzando audio da dimostrazioni reali.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo sistema aiuta i robot ad apprendere compiti utilizzando audio da dimostrazioni reali.
― 7 leggere min
Un metodo semplice per creare voci e controllare le emozioni nella sintesi vocale.
― 5 leggere min
Un approccio innovativo per migliorare la chiarezza del suono usando tecniche avanzate di deep learning.
― 7 leggere min
Tecniche innovative migliorano il design degli altoparlanti e la direzione del suono.
― 5 leggere min
Questo studio si concentra sul miglioramento della rilevazione dell'audio deepfake usando metodi avanzati.
― 5 leggere min
La ricerca sottolinea il ruolo del video nel migliorare il riconoscimento vocale in ambienti rumorosi.
― 5 leggere min
I progressi nella classificazione del suono migliorano la precisione del riconoscimento audio.
― 6 leggere min
Nuovo dataset migliora la generazione audio da descrizioni testuali dettagliate.
― 5 leggere min
Un nuovo metodo aiuta i modelli più piccoli a funzionare meglio usando suggerimenti dai modelli più grandi.
― 6 leggere min
ElasticAST consente di elaborare audio a lunghezza variabile in modo efficiente senza perdere dettagli importanti.
― 5 leggere min
Un nuovo metodo migliora il rilevamento di clip audio miste tra reali e falsi.
― 6 leggere min
Un nuovo dataset che unisce immagini, testi e audio per la ricerca su scene interne.
― 5 leggere min
CADE migliora il rilevamento audio contro le minacce di spoofing in evoluzione usando tecniche di apprendimento continuo.
― 7 leggere min
Un nuovo dataset punta a migliorare la cattura del parlato usando sensori a conduzione corporea.
― 6 leggere min
Un team migliora l'elaborazione audio per l'identificazione di speaker e lingue.
― 5 leggere min
Un nuovo modello di testo-audio che usa solo dati pubblici.
― 5 leggere min
Una nuova tecnologia semplifica l'equalizzazione per le registrazioni audio.
― 5 leggere min
Migliorare la qualità audio nei dispositivi attraverso tecniche di espansione della larghezza di banda.
― 6 leggere min
Un nuovo metodo migliora la separazione delle voci in ambienti rumorosi con più parlanti.
― 5 leggere min
Wavespace offre strumenti innovativi per creare e controllare il suono in modo migliore.
― 6 leggere min
La ricerca si concentra sull'identificazione del linguaggio abusivo nelle registrazioni audio in diverse lingue.
― 5 leggere min
Un metodo per creare audio che si abbina ai video in prima persona.
― 7 leggere min
Uno studio su come migliorare i metodi per rilevare la compressione audio con perdita per un suono di qualità migliore.
― 6 leggere min
Esaminando tecniche per proteggere la privacy mentre si analizzano conversazioni registrate.
― 5 leggere min
Migliorare la riproduzione del suono binaurale per esperienze audio migliori su vari dispositivi.
― 7 leggere min
Nuovo modello di machine learning migliora le tecniche di separazione delle sorgenti audio.
― 5 leggere min
Music2Latent semplifica la compressione audio mantenendo un'alta qualità per vari utilizzi.
― 6 leggere min
Un sistema per migliorare la chiarezza del parlato in ambienti rumorosi usando occhiali smart.
― 5 leggere min
Uno studio per identificare i momenti di discorso d'odio nell'audio usando tecniche innovative.
― 5 leggere min
Presentiamo PeriodWave, un modello che migliora la velocità e la qualità della generazione audio.
― 6 leggere min
PeriodWave-Turbo migliora la velocità e la qualità della generazione del suono in diverse applicazioni.
― 5 leggere min
MAT-SED usa un nuovo modello Transformer per una rilevazione efficace degli eventi sonori.
― 5 leggere min
Auptimize migliora il posizionamento degli segnali audio per un'interazione utente migliore in XR.
― 6 leggere min
Malacopula mette in dubbio l'affidabilità delle tecnologie di verifica automatica degli speaker.
― 6 leggere min
I falsi audio sono un problema serio; metodi di rilevamento efficaci sono essenziali.
― 6 leggere min
Un nuovo metodo migliora l'accuratezza nel rilevare audio sintetico.
― 6 leggere min
Un nuovo algoritmo migliora la sicurezza audio incorporando messaggi nascosti in modo meno rilevabile.
― 5 leggere min
Metodi recenti migliorano il watermarking audio per una qualità del suono migliore e una gestione del copyright più efficace.
― 5 leggere min
X-Codec migliora la generazione audio integrando la comprensione semantica nel processo.
― 6 leggere min
Scopri come un microfono in più migliora la rilevazione della direzione del suono in ambienti rumorosi.
― 5 leggere min