Usare embeddings audio pre-addestrati porta a modelli di classificazione musicale migliori.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
Usare embeddings audio pre-addestrati porta a modelli di classificazione musicale migliori.
― 7 leggere min
La ricerca mette in evidenza il ruolo dei confini delle parole nel linguaggio e nell'attività EEG.
― 6 leggere min
Nuovo framework migliora la chiarezza del parlato da video silenziosi grazie a un'elaborazione migliorata.
― 6 leggere min
Scopri il mix tra arte e scienza nello studio del mridangam.
― 7 leggere min
Un nuovo metodo migliora il riconoscimento delle parole personalizzate nei sistemi ASR per lingue con dati limitati.
― 5 leggere min
I ricercatori sviluppano un modello Conformer per migliorare il rilevamento dell'audio falso.
― 5 leggere min
Un metodo per nascondere le informazioni di genere pur garantendo la verifica dell'identità nel riconoscimento vocale.
― 5 leggere min
Nuovi metodi migliorano la diagnosi precoce dell'Alzheimer usando analisi del parlato e dell'audio.
― 7 leggere min
Esplora dati sonori di 41 strumenti musicali con registrazioni dettagliate.
― 6 leggere min
Ricerca su come migliorare i word embeddings acustici con comprensione semantica e dati multilingue.
― 6 leggere min
Le nuove tecnologie migliorano la comunicazione per chi ha disturbi del linguaggio.
― 6 leggere min
Un nuovo sistema combina trascrizione e traduzione per una comunicazione migliore.
― 5 leggere min
Whisper-AT combina il riconoscimento vocale e il tagging audio per migliorare le prestazioni.
― 6 leggere min
Un nuovo approccio che combina il parlato con i modelli linguistici per una traduzione migliorata.
― 5 leggere min
Nuovo metodo migliora la precisione nel trasformare l'audio del pianoforte in partiture.
― 4 leggere min
Questo articolo parla delle esigenze e delle sfide nella tecnologia audio generativa.
― 5 leggere min
Nuovi metodi usano i suoni della tosse e i dati sulla salute per rilevare meglio la tubercolosi.
― 6 leggere min
Questo studio esplora come le caratteristiche vocali si evolvono nei pazienti con cancro orale dopo il trattamento.
― 6 leggere min
Un nuovo metodo per cambiare il timbro musicale usando tecniche avanzate di machine learning.
― 5 leggere min
Nuovi metodi migliorano l'accuratezza del riconoscimento vocale, risolvendo errori di trascrizione comuni.
― 4 leggere min
Uno studio su come migliorare la riproduzione del suono vocale attraverso tecniche di sintesi avanzate.
― 6 leggere min
VampNet trasforma la lavorazione della musica grazie a tecniche innovative di modeling dei token.
― 4 leggere min
Tecnologia indossabile conveniente per persone con perdita uditiva.
― 5 leggere min
Un nuovo modello migliora la precisione dei tempi per i testi nelle app musicali.
― 6 leggere min
Un sintetizzatore web che consente agli utenti di creare musica usando gesti semplici.
― 5 leggere min
Uno studio sul ruolo dell'IA nella generazione di musica metal progressivo.
― 6 leggere min
Un modello che crea tablature per chitarra che riflettono gli stili dei famosi chitarristi.
― 6 leggere min
Esplorare il potenziale dell'apprendimento auto-supervisionato nel recupero di informazioni musicali.
― 6 leggere min
Usare segnali audio per identificare i rischi per la salute respiratoria.
― 8 leggere min
Un nuovo metodo migliora la velocità e l'accuratezza del riconoscimento vocale riducendo l'uso delle risorse.
― 6 leggere min
Questo studio migliora il monitoraggio della fauna selvatica usando le caratteristiche audio per una migliore classificazione dei suoni.
― 9 leggere min
Urhythmic migliora la conversione vocale concentrandosi sul ritmo del parlato.
― 5 leggere min
La ricerca migliora le tecniche di fingerstyle percussivo per chitarristi usando il recupero del suono in tempo reale.
― 8 leggere min
Questo articolo esplora un nuovo modello per l'identificazione dell'intento e dei slot nel parlato.
― 6 leggere min
Con l'avanzare della tecnologia di clonazione vocale, metodi di rilevamento affidabili diventano fondamentali.
― 7 leggere min
Nuovo metodo migliora il riconoscimento vocale usando solo dati audio grezzi.
― 5 leggere min
Uno studio migliora il riconoscimento vocale per le persone anziane, usando tecniche innovative.
― 6 leggere min
BASS migliora il riassunto di audio lunghi trattando in blocchi.
― 5 leggere min
Nuovi metodi presentano seri rischi per la sicurezza della tecnologia di riconoscimento vocale.
― 7 leggere min
ivrit.ai offre risorse fondamentali per migliorare la tecnologia ASR in ebraico.
― 6 leggere min