Ingegneria elettrica e scienze dei sistemi - Elaborazione dell'audio e del parlato

RSS

Elaborazione dell'audio e del parlato Gestione Efficiente di Grandi Modelli di Voce

Un nuovo metodo ottimizza i modelli vocali per migliori prestazioni con meno risorse.

2025-10-23T21:54:10+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Nuovo Metodo per la Valutazione Obiettiva dell'Audio Spaziale

Un approccio nuovo migliora il modo in cui valutiamo la qualità dell'audio spaziale.

2025-10-23T19:28:25+00:00 ― 5 leggere min

Suono Identificare il parlato letto vs. il parlato spontaneo nelle interviste

Uno studio su come distinguere tra discorso letto e discorso spontaneo.

2025-10-23T18:39:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato StyleTTS 2: Avanzando la tecnologia Text-to-Speech

Un nuovo modello migliora il realismo del parlato sintetico.

2025-10-23T15:25:30+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Malafide: Una Nuova Sfida per i Sistemi di Riconoscimento Vocale

Malafide introduce tecniche di spoofing sofisticate, complicando le contromisure nel riconoscimento vocale.

2025-10-23T14:36:55+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel tracciamento delle fonti sonore con PI-RNN

Un nuovo modello migliora l'accuratezza e l'efficienza nel tracciare le fonti sonore.

2025-10-23T10:34:00+00:00 ― 5 leggere min

Calcolo e linguaggio Presentiamo il dataset ITALIC per l'italiano parlato

Un nuovo dataset migliora la comprensione del linguaggio parlato per l'italiano.

2025-10-23T08:56:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nell'Apprendimento Auto-Supervisionato per l'Elaborazione del Parlato

MCR-Data2vec 2.0 migliora il riconoscimento vocale rendendo il modello più consistente.

2025-10-23T08:08:15+00:00 ― 4 leggere min

Apprendimento automatico EM-Network: Un Nuovo Approccio nell'Apprendimento delle Sequenze

EM-Network migliora l'apprendimento delle sequenze nei compiti di elaborazione del parlato e del linguaggio.

2025-10-23T07:19:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nei modelli ASR bilingui e code-switched

Nuovi metodi migliorano il riconoscimento vocale multilingue usando fonti di dati esistenti.

2025-10-23T04:05:20+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale per le lingue a basse risorse

La ricerca si concentra sul miglioramento della tecnologia vocale per lingue che non hanno abbastanza dati.

2025-10-22T23:13:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nelle Tecniche di Miglioramento del Suono

Uno sguardo ai recenti sviluppi per migliorare la chiarezza audio usando modelli avanzati.

2025-10-22T21:36:40+00:00 ― 5 leggere min

Suono Valutare la difficoltà dei pezzi per pianoforte con un nuovo dataset

Un nuovo set di dati punta a classificare i punteggi del pianoforte per livello di difficoltà.

2025-10-22T20:48:05+00:00 ― 7 leggere min

Suono Miglioramenti nella Qualità del Suono

Il framework Gesper migliora la chiarezza del parlato in ambienti rumorosi.

2025-10-22T19:59:30+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il miglioramento del parlato con tecniche di normalizzazione

Questo studio presenta un nuovo metodo per migliorare la qualità del parlato usando modelli già addestrati.

2025-10-22T19:10:55+00:00 ― 6 leggere min

Intelligenza artificiale Migliorare il Riconoscimento del Linguaggio D'odio nei Multimedia

Combinare audio, video e testo migliora il rilevamento dell'odio.

2025-10-22T15:08:00+00:00 ― 6 leggere min

Suono Un Approccio Semplificato al HMM Ibrido per ASR

Questo articolo parla di un nuovo metodo per costruire sistemi ASR efficienti.

2025-10-22T14:19:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Personalizzare il riconoscimento vocale sui dispositivi mobili

Un nuovo approccio migliora il riconoscimento vocale direttamente sugli smartphone, garantendo la privacy dell'utente.

2025-10-22T10:16:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Nuovo sistema migliora l'identificazione degli speaker nell'audio

Un nuovo metodo migliora l'accuratezza nell'identificare i relatori durante le conversazioni.

2025-10-22T09:27:55+00:00 ― 5 leggere min

Suono Avanzamenti nella rilevazione di eventi bioacustici a pochi colpi

I team migliorano l'identificazione dei suoni degli animali con pochi esempi nella sfida DCASE.

2025-10-22T07:50:45+00:00 ― 6 leggere min

Suono Sfruttare il tagging audio su computer piccoli

Scopri i sistemi di tagging audio e il loro utilizzo su Raspberry Pi.

2025-10-22T06:13:35+00:00 ― 5 leggere min

Suono Avanzamenti negli algoritmi per l'identificazione delle cover

Nuove tecniche migliorano la precisione e l'efficienza nell'identificare le cover.

2025-10-22T05:25:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia di controllo attivo del rumore

Nuovo metodo migliora il controllo del rumore negli spazi 3D.

2025-10-22T01:22:05+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Nuovo dataset e modello per il text-to-speech multilingue

CML-TTS permette di avere sistemi di sintesi vocale migliori in sette lingue.

2025-10-21T18:04:50+00:00 ― 5 leggere min

Suono Valutare la qualità del parlato con modelli di machine learning

Questo studio valuta vari modelli per prevedere la qualità del parlato sintetizzato.

2025-10-21T16:27:40+00:00 ― 6 leggere min

Suono Progressi nei Metodi di Classificazione dei Suoni degli Uccelli

I ricercatori automatizzano la classificazione dei suoni degli uccelli, migliorando l'accuratezza nel monitoraggio delle specie.

2025-10-21T14:50:30+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato FALL-E: Una Nuova Era nella Creazione Sonora

FALL-E crea effetti sonori di alta qualità a partire da descrizioni testuali.

2025-10-21T13:13:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Trasformare il linguaggio normale per chi ha disartria

Un nuovo metodo migliora la conversione vocale per le persone con linguaggio atipico.

2025-10-21T05:56:05+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nel riconoscimento vocale multi-parlante con SURT 2.0

SURT 2.0 migliora il riconoscimento vocale per più parlanti in situazioni in tempo reale.

2025-10-21T05:07:30+00:00 ― 6 leggere min

Suono Presentiamo MARBLE: un benchmark per l'AI musicale

MARBLE stabilisce uno standard per valutare i modelli di intelligenza artificiale musicale su più attività.

2025-10-21T04:18:55+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Nuovo modello migliora il riconoscimento dei suoni degli uccelli

Un nuovo metodo migliora l'accuratezza nell'identificare i canti degli uccelli.

2025-10-21T03:30:20+00:00 ― 6 leggere min

Suono Migliorare l'elaborazione audio con i livelli SFI

Nuovi algoritmi migliorano le prestazioni di elaborazione audio su diverse frequenze di campionamento.

2025-10-21T00:16:00+00:00 ― 5 leggere min

Suono Usare il suono per separare i maschi delle zanzare per il controllo dei parassiti

La ricerca esplora l'analisi sonora per migliorare la selezione delle zanzare per il controllo delle malattie.

2025-10-20T21:50:15+00:00 ― 5 leggere min

Suono Trasformare i suoni vocali con tecniche DSP

Esplora due metodi innovativi per modificare il timbro vocale usando il Digital Signal Processing.

2025-10-20T14:33:00+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel riconoscimento vocale automatico

Un nuovo metodo migliora la tecnologia di riconoscimento vocale senza perdere le conoscenze apprese in precedenza.

2025-10-20T13:44:25+00:00 ― 6 leggere min

Suono Avanzamenti nella trascrizione musicale multitraccia con Perceiver TF

Un nuovo modello migliora l'accuratezza della trascrizione musicale per più strumenti.

2025-10-20T12:07:15+00:00 ― 6 leggere min

Suono Progressi nel processamento audio con DAMAS-FISTA

Un nuovo metodo combina apprendimento tradizionale e profondo per un'imaging del suono efficiente.

2025-10-20T11:18:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella Ricostruzione del Campo Sonoro

Nuovi metodi migliorano il realismo nelle tecnologie audio usando tecniche informate dalla fisica.

2025-10-20T10:30:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Promuovere l'apprendimento delle lingue per lingue a bassa risorsa

Un nuovo modello migliora l'apprendimento delle parole usando audio e immagini.

2025-10-20T09:41:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Il ruolo del riconoscimento vocale nell'integrità delle sperimentazioni cliniche

Indagando su come la tecnologia vocale può prevenire la partecipazione duplicata dei pazienti negli studi clinici.

2025-10-20T07:15:45+00:00 ― 7 leggere min