La ricerca su nuovi modelli migliora la qualità audio nei film e nella televisione.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
La ricerca su nuovi modelli migliora la qualità audio nei film e nella televisione.
― 6 leggere min
DiM-Gesture crea gesti realistici sincronizzati con il parlato per le interazioni digitali.
― 5 leggere min
Analizzare i suoni di un bambino rivela fasi cruciali della crescita del linguaggio.
― 6 leggere min
Nuovi metodi per un miglior controllo delle RNN migliorano le simulazioni degli effetti audio.
― 9 leggere min
MulliVC trasforma le voci tra le lingue con una precisione e chiarezza impressionanti.
― 5 leggere min
Un sistema che permette l'autenticazione vocale in più lingue per dispositivi mobili.
― 6 leggere min
TEAdapter migliora la generazione di musica da testo, dando agli utenti maggiore controllo e creatività.
― 5 leggere min
Un nuovo framework migliora il rilevamento dei suoni delle macchine usando tecniche di apprendimento attivo.
― 5 leggere min
Questo studio esamina come diversi metodi di sintesi influenzano qualità e contenuto.
― 5 leggere min
Nuovo modello di machine learning migliora le tecniche di separazione delle sorgenti audio.
― 5 leggere min
Music2Latent semplifica la compressione audio mantenendo un'alta qualità per vari utilizzi.
― 6 leggere min
Il modello TOGGL migliora l'accuratezza della trascrizione in situazioni di discorso sovrapposto.
― 5 leggere min
Un sistema per migliorare la chiarezza del parlato in ambienti rumorosi usando occhiali smart.
― 5 leggere min
Uno studio per identificare i momenti di discorso d'odio nell'audio usando tecniche innovative.
― 5 leggere min
Un metodo per migliorare la qualità del riconoscimento vocale in ambienti rumorosi.
― 7 leggere min
Un metodo per generare musica coinvolgente gestendo i livelli di sorpresa.
― 5 leggere min
Un nuovo approccio codifica e ricostruisce segnali sensoriali usando treni di impulsi.
― 7 leggere min
Questo articolo parla di come usare il deep learning per prevedere le reazioni emotive alla musica.
― 6 leggere min
Un nuovo metodo per visualizzare le distribuzioni sonore globali usando dati audio e satellitari.
― 6 leggere min
Esplorare nuovi metodi nella compressione audio per una qualità del suono migliore.
― 7 leggere min
La ricerca si concentra sul rilevamento dell'audio deepfake attraverso tecniche migliorate e l'espansione dei dati.
― 5 leggere min
Un nuovo approccio si concentra su piccole incoerenze nella rilevazione dei deepfake.
― 6 leggere min
Esaminando come la lunghezza dell'utterance e i fattori sociali influenzano il ritmo del parlato.
― 5 leggere min
Presentiamo PeriodWave, un modello che migliora la velocità e la qualità della generazione audio.
― 6 leggere min
Impara a preparare e presentare il tuo articolo scientifico in modo efficace.
― 7 leggere min
Uno sguardo a come le caratteristiche sonore nella musica popolare siano cambiate nel corso dei decenni.
― 5 leggere min
Un nuovo sistema migliora la creazione di tablature per chitarra usando metodi di deep learning.
― 5 leggere min
Un nuovo sistema migliora il riconoscimento vocale usando parole chiave contestuali per una maggiore precisione.
― 6 leggere min
PeriodWave-Turbo migliora la velocità e la qualità della generazione del suono in diverse applicazioni.
― 5 leggere min
La ricerca mostra come rendere i modelli di linguaggio più piccoli ed efficienti.
― 5 leggere min
La separazione dei dialoghi aiuta gli spettatori a sentire chiaramente le conversazioni in mezzo al rumore di fondo.
― 6 leggere min
MAT-SED usa un nuovo modello Transformer per una rilevazione efficace degli eventi sonori.
― 5 leggere min
Combinare i suoni cardiaci e l'ecocardiografia per migliorare la diagnosi delle malattie cardiache congénite.
― 6 leggere min
Un ricco set di dati di registrazioni di chitarra collegate a spartiti musicali per ricerca e analisi.
― 4 leggere min
Auptimize migliora il posizionamento degli segnali audio per un'interazione utente migliore in XR.
― 6 leggere min
Malacopula mette in dubbio l'affidabilità delle tecnologie di verifica automatica degli speaker.
― 6 leggere min
Un nuovo metodo per animazioni facciali 3D più realistiche che si adattano agli stili di parlato personali.
― 5 leggere min
L'addestramento avversariale migliora l'accuratezza del riconoscimento delle parole chiave nel parlato sintetico e reale.
― 5 leggere min
Questo pezzo parla del few-shot learning e del suo impatto sui task audio.
― 7 leggere min
Una nuova tecnologia collega i tratti del viso alla voce, aiutando la comunicazione per chi non può parlare.
― 5 leggere min