Un nuovo modello migliora il realismo del parlato sintetico.
― 8 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo modello migliora il realismo del parlato sintetico.
― 8 leggere min
Un nuovo modello migliora l'accuratezza e l'efficienza nel tracciare le fonti sonore.
― 5 leggere min
Un nuovo dataset migliora la comprensione del linguaggio parlato per l'italiano.
― 6 leggere min
Nuovi metodi migliorano il riconoscimento vocale multilingue usando fonti di dati esistenti.
― 6 leggere min
La ricerca si concentra sul miglioramento della tecnologia vocale per lingue che non hanno abbastanza dati.
― 6 leggere min
Uno sguardo ai recenti sviluppi per migliorare la chiarezza audio usando modelli avanzati.
― 5 leggere min
Un nuovo set di dati punta a classificare i punteggi del pianoforte per livello di difficoltà.
― 7 leggere min
Il framework Gesper migliora la chiarezza del parlato in ambienti rumorosi.
― 5 leggere min
Questo studio presenta un nuovo metodo per migliorare la qualità del parlato usando modelli già addestrati.
― 6 leggere min
Combinare audio, video e testo migliora il rilevamento dell'odio.
― 6 leggere min
Questo articolo parla di un nuovo metodo per costruire sistemi ASR efficienti.
― 5 leggere min
Un nuovo metodo che utilizza le Reti Neurali a Grafi migliora l'analisi dei Numeri Romani per la musica.
― 6 leggere min
I team migliorano l'identificazione dei suoni degli animali con pochi esempi nella sfida DCASE.
― 6 leggere min
Scopri i sistemi di tagging audio e il loro utilizzo su Raspberry Pi.
― 5 leggere min
Nuove tecniche migliorano la precisione e l'efficienza nell'identificare le cover.
― 5 leggere min
Nuovo metodo migliora il controllo del rumore negli spazi 3D.
― 4 leggere min
Questo studio valuta vari modelli per prevedere la qualità del parlato sintetizzato.
― 6 leggere min
I ricercatori automatizzano la classificazione dei suoni degli uccelli, migliorando l'accuratezza nel monitoraggio delle specie.
― 5 leggere min
FALL-E crea effetti sonori di alta qualità a partire da descrizioni testuali.
― 5 leggere min
SURT 2.0 migliora il riconoscimento vocale per più parlanti in situazioni in tempo reale.
― 6 leggere min
MARBLE stabilisce uno standard per valutare i modelli di intelligenza artificiale musicale su più attività.
― 7 leggere min
Un nuovo metodo migliora l'accuratezza nell'identificare i canti degli uccelli.
― 6 leggere min
Nuovi algoritmi migliorano le prestazioni di elaborazione audio su diverse frequenze di campionamento.
― 5 leggere min
La ricerca esplora l'analisi sonora per migliorare la selezione delle zanzare per il controllo delle malattie.
― 5 leggere min
Esplora due metodi innovativi per modificare il timbro vocale usando il Digital Signal Processing.
― 4 leggere min
Un nuovo metodo migliora la tecnologia di riconoscimento vocale senza perdere le conoscenze apprese in precedenza.
― 6 leggere min
Un nuovo modello migliora l'accuratezza della trascrizione musicale per più strumenti.
― 6 leggere min
Un nuovo metodo combina apprendimento tradizionale e profondo per un'imaging del suono efficiente.
― 6 leggere min
Nuovi metodi migliorano il realismo nelle tecnologie audio usando tecniche informate dalla fisica.
― 6 leggere min
Indagando su come la tecnologia vocale può prevenire la partecipazione duplicata dei pazienti negli studi clinici.
― 7 leggere min
Un nuovo dataset aiuta a identificare segni di depressione e ansia attraverso l'analisi del parlato.
― 7 leggere min
Nuovo metodo ricostruisce il suono dai segnali cerebrali, rivelando intuizioni sul processamento uditivo.
― 5 leggere min
Una guida per usare modelli AI per la musica sulla piattaforma Bela.
― 5 leggere min
NoRefER offre un modo nuovo per valutare i risultati del riconoscimento vocale senza bisogno di trascrizioni.
― 6 leggere min
Quest'articolo parla di un metodo per migliorare i sottotitoli dei video incorporando l'audio.
― 6 leggere min
Un nuovo modello migliora la conversione vocale semplificando le tecniche di separazione del parlato.
― 7 leggere min
La ricerca punta a combinare dati audio e simbolici per analizzare la somiglianza musicale.
― 7 leggere min
Nuovi metodi migliorano la segmentazione del parlato nelle conversazioni multilingue.
― 6 leggere min
NoisyILRMA migliora l'estrazione del suono dal rumore di fondo per un'esperienza audio più chiara.
― 4 leggere min
Questo articolo parla del ruolo dell'apprendimento auto-supervisionato nella tecnologia musicale.
― 6 leggere min