WildDESED migliora i sistemi di rilevamento sonoro in ambienti domestici rumorosi.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
WildDESED migliora i sistemi di rilevamento sonoro in ambienti domestici rumorosi.
― 6 leggere min
Uno studio rivela come diversi generi musicali attivano aree cerebrali distinte.
― 6 leggere min
Regole fondamentali per inviare articoli a NeurIPS 2024.
― 4 leggere min
Questo articolo parla di come migliorare la MUSICA con il calcolo approssimato per ottenere prestazioni migliori.
― 6 leggere min
Un nuovo sistema migliora l'accuratezza e l'efficienza nella trascrizione musicale multi-strumento.
― 5 leggere min
Un nuovo modello migliora la precisione nelle capacità di trascrizione vocale in più lingue.
― 5 leggere min
Sviluppi nel prevedere la qualità del parlato usando metodi efficienti per dispositivi mobili.
― 5 leggere min
Un metodo per migliorare il timbro nella produzione musicale attraverso i sintetizzatori.
― 6 leggere min
Questo studio valuta la tecnologia vocale in lingue a basso costo come l'arabo tunisino.
― 5 leggere min
La ricerca rivela rischi nei modelli di riconoscimento vocale multitasking come Whisper.
― 5 leggere min
TokenVerse semplifica l'analisi delle conversazioni parlate integrando più compiti in un unico modello.
― 6 leggere min
Nuovo dataset migliora la generazione audio da descrizioni testuali dettagliate.
― 5 leggere min
Un modo nuovo per gli artisti di collegare la creatività con la generazione audio dell'IA.
― 6 leggere min
Esplorare l'impatto dei modelli TTM sulla creazione musicale e sulle esperienze degli utenti.
― 7 leggere min
Questo articolo esamina la latenza di vari sistemi di diarizzazione degli speaker nell'elaborazione audio.
― 6 leggere min
Nuovo dataset punta a migliorare il riconoscimento vocale per i parlanti non nativi dell'inglese.
― 6 leggere min
Un nuovo framework, BiosERC, migliora il riconoscimento delle emozioni tenendo conto delle caratteristiche del parlante.
― 6 leggere min
Questo studio esamina come le preferenze vocali variano tra diversi ascoltatori.
― 5 leggere min
Questo articolo presenta un metodo per generare suoni precisi da video e testo.
― 7 leggere min
Un nuovo modello migliora la simulazione degli strumenti a corde per un suono realistico.
― 7 leggere min
Introducendo un metodo per avere un controllo migliore nell'editing del parlato.
― 5 leggere min
Uno studio per classificare la musica in base all'epoca usando le caratteristiche audio e le intuizioni degli artisti.
― 6 leggere min
Un nuovo modello migliora lo studio della comunicazione animale usando dati audio grezzi.
― 6 leggere min
Un nuovo sistema migliora l'efficienza dell'elaborazione dei segnali tramite metodi di codifica innovativi.
― 6 leggere min
Un team affronta le sfide dell'identificazione dei canti degli uccelli nella competizione BirdCLEF 2024.
― 6 leggere min
Presentiamo i dataset MERGE per migliorare la classificazione delle emozioni nella musica.
― 6 leggere min
Questo studio esamina il Mix-Training per il riconoscimento delle parole chiave in condizioni di parlato rumoroso.
― 5 leggere min
Un nuovo metodo aiuta i modelli più piccoli a funzionare meglio usando suggerimenti dai modelli più grandi.
― 6 leggere min
Esplora gli aggiornamenti nella versione 3 del dataset Divide and Remaster.
― 6 leggere min
Una panoramica completa dei dataset utilizzati nei modelli audio-linguistici e della loro importanza.
― 11 leggere min
Un sistema affidabile basato su auricolari monitora le frequenze respiratorie durante diverse attività quotidiane.
― 6 leggere min
Migliorare i sistemi di riconoscimento vocale per le lingue con pochi dati online.
― 5 leggere min
Unire suoni e immagini per sistemi di riconoscimento più intelligenti.
― 7 leggere min
Un metodo per migliorare il rilevamento di deepfake audio attraverso l'aumento dei dati.
― 5 leggere min
Beat-It genera movimenti di danza sincronizzati per migliorare la coreografia senza sforzo.
― 6 leggere min
I ricercatori vogliono creare suoni che si abbinino a video silenziosi, migliorando l'esperienza degli spettatori.
― 5 leggere min
Questo studio affronta i problemi con i sistemi SLU e la loro capacità di generalizzare.
― 7 leggere min
Uno strumento auto-supervisionato per stimare le tonalità musicali, riducendo le annotazioni degli esperti.
― 6 leggere min
Diff-MST migliora il mixing musicale applicando il trasferimento di stile da brani di riferimento.
― 6 leggere min
Un nuovo modello migliora la comunicazione per le persone con disabilità usando il riconoscimento vocale e il codice Morse.
― 5 leggere min