Un nuovo metodo migliora il riconoscimento dei suoni e la localizzazione delle fonti senza etichette.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo metodo migliora il riconoscimento dei suoni e la localizzazione delle fonti senza etichette.
― 6 leggere min
Un nuovo punto di riferimento per migliorare la precisione dell'ASR usando modelli di linguaggio.
― 6 leggere min
Nuovi metodi migliorano la traduzione del parlato concentrandosi sulle informazioni contestuali.
― 5 leggere min
Un nuovo metodo migliora il riconoscimento vocale per gli utenti che alternano tra lingue.
― 5 leggere min
Scopri come l'analisi del suono aiuta a identificare i problemi delle macchine in modo efficiente.
― 6 leggere min
Questo progetto migliora i sistemi di traduzione vocale in tempo reale e di sottotitolazione automatica.
― 4 leggere min
Esplorando come la nitidezza dei minimi influisca sulle prestazioni del modello su dati audio non visti.
― 5 leggere min
Nuovo metodo migliora la verifica dell'identità degli speaker unendo dati audio e visivi.
― 5 leggere min
Uno studio sull'uso dei transformer per un tagging e una rappresentazione musicale efficace.
― 7 leggere min
Un nuovo metodo migliora il tracciamento degli speaker usando dati audio e visivi.
― 7 leggere min
Un nuovo modo per valutare la difficoltà della musica per pianoforte usando immagini delle partiture.
― 6 leggere min
PP-MeT punta a migliorare l'accuratezza nella trascrizione di incontri con più partecipanti.
― 5 leggere min
Questa ricerca presenta un modello per migliorare la chiarezza del discorso in diverse condizioni.
― 5 leggere min
Esplorando i progressi nella didascalia audio automatica e il suo impatto sull'accessibilità.
― 5 leggere min
La ricerca presenta un metodo efficace per migliorare la chiarezza del parlato in ambienti rumorosi.
― 7 leggere min
Un nuovo metodo semplifica il trasferimento di stile audio usando effetti non differenziabili.
― 7 leggere min
La ricerca esamina come la musica computerizzata si confronta con le performance umane attraverso test di ascolto.
― 7 leggere min
Scopri come i polinomi ultrasferici migliorano la tecnologia audio e la direzionalità del suono.
― 6 leggere min
Usare l'IA per migliorare come ricreiamo il suono in ambienti diversi.
― 5 leggere min
Un nuovo metodo migliora il riconoscimento vocale usando meno etichette e risorse.
― 7 leggere min
Nuovi metodi migliorano il collegamento tra descrizioni testuali e eventi sonori.
― 7 leggere min
Metodi innovativi migliorano il modo in cui i robot elaborano la direzione del suono mentre sono in movimento.
― 6 leggere min
Scopri il beamforming a valori reali e i suoi vantaggi per le array di microfoni.
― 6 leggere min
Un nuovo approccio per generare discorsi piccoli, efficienti e che suonano naturali.
― 9 leggere min
MusicAOG semplifica la creazione e la comprensione della musica tramite un'innovativa rappresentazione grafica.
― 6 leggere min
Un nuovo framework per combinare array di microfoni e altoparlanti sferici negli studi sul suono.
― 6 leggere min
Un nuovo framework per migliorare il rilevamento dei suoni nei robot umanoidi attraverso il design della matrice di microfoni.
― 8 leggere min
Scopri come i sistemi MIMO migliorano l'analisi del suono in diversi ambienti.
― 7 leggere min
Nuove tecniche migliorano la stima della direzione del suono per vari ambienti audio.
― 5 leggere min
La ricerca svela metodi per regolare il comportamento del suono nelle stanze per una maggiore chiarezza.
― 4 leggere min
Un nuovo modello identifica i momenti divertenti nei video usando dati visivi, audio e di testo.
― 6 leggere min
Gli elastomeri dielettrici trasformano l'energia elettrica in movimento meccanico, offrendo diverse applicazioni.
― 7 leggere min
I trascrizioni ASR con errori possono aiutare a identificare l'Alzheimer in modo più preciso.
― 8 leggere min
ELLA-V migliora la qualità e il controllo del testo in voce, superando i modelli precedenti.
― 6 leggere min
Un nuovo approccio migliora l'accuratezza nella rilevazione dei richiami animali senza soglie arbitrarie.
― 7 leggere min
Un nuovo modello integra audio e testo per una migliore classificazione del parlato.
― 7 leggere min
Una nuova iniziativa per migliorare la tecnologia di trascrizione per le riunioni in grandi stanze.
― 7 leggere min
Nuovi metodi migliorano la precisione nel riconoscimento vocale rumoroso utilizzando modelli linguistici grandi.
― 6 leggere min
Analizzare i suoni delle galline aiuta a migliorare la loro salute e la produttività della fattoria.
― 8 leggere min
Un metodo per aiutare i non vedenti a riconoscere i suoni nella realtà mista.
― 5 leggere min