Ingegneria elettrica e scienze dei sistemi - Elaborazione dell'audio e del parlato

RSS

Elaborazione dell'audio e del parlato Sviluppi nella Verifica dell'Identità del Parlatore contro Attacchi di Inganno

Metodi innovativi migliorano la sicurezza nei sistemi di riconoscimento vocale.

2025-06-23T01:42:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento audio attraverso l'apprendimento multi-modale

Un nuovo framework migliora la classificazione audio sfruttando la conoscenza dei dispositivi multi-modali.

2025-06-23T00:53:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sistema innovativo per riduzione di eco e rumore

Un nuovo approccio migliora la chiarezza della comunicazione riducendo l'eco e i rumori di fondo.

2025-06-23T00:05:05+00:00 ― 5 leggere min

Suono VoxInstruct: Un Nuovo Modo di Generare Voce

VoxInstruct combina contenuto e stile per generare un discorso più naturale.

2025-06-22T23:16:30+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare l'accuratezza del riconoscimento vocale automatico

Uno sguardo alla misurazione dell'accuratezza nei sistemi di riconoscimento vocale con nuovi metodi.

2025-06-22T20:50:45+00:00 ― 6 leggere min

Suono Avanzamenti nella verifica dell'identità vocale usando Whisper

Un nuovo metodo migliora l'accuratezza del riconoscimento vocale in diverse lingue.

2025-06-22T18:25:00+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nel miglioramento del parlato con il windowing temporale-contextuale

Esplorando un nuovo approccio per migliorare la qualità del parlato usando finestre temporali contestuali.

2025-06-22T17:36:25+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nelle tecniche di watermarking audio digitale

Metodi recenti migliorano il watermarking audio per una qualità del suono migliore e una gestione del copyright più efficace.

2025-06-22T15:59:15+00:00 ― 5 leggere min

Suono Sviluppi nella tecnologia di conversione vocale

Un nuovo metodo per migliorare la qualità della conversione vocale in tempo reale.

2025-06-22T07:04:50+00:00 ― 6 leggere min

Calcolo e linguaggio Presentiamo SALSA: Un Nuovo Metodo per Migliorare l'ASR

SALSA migliora la precisione del riconoscimento vocale per le lingue a basse risorse integrando i modelli ASR e i modelli linguistici.

2025-06-22T06:16:15+00:00 ― 6 leggere min

Suono Sviluppi nella tecnologia Text-to-Speech

Nuovi metodi migliorano la qualità della sintesi vocale nei sistemi TTS.

2025-06-22T05:27:40+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare l'accuratezza dell'ASR per l'accessibilità

Esaminare le performance del riconoscimento automatico della voce per utenti sordi e ipoudenti.

2025-06-22T01:24:45+00:00 ― 12 leggere min

Calcolo e linguaggio Affinando i testi delle canzoni con un nuovo modello

Un nuovo modello trasforma testi normali in testi di canzoni adatti.

2025-06-21T23:47:35+00:00 ― 6 leggere min

Calcolo e linguaggio Il Movimento delle Vocali Inglesi: Dittonghi vs. Monottonghi

Questo studio analizza come i dittonghi e i monottonghi differiscano nella produzione e nel movimento.

2025-06-21T22:10:25+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il Riconoscimento Vocale Automatico con Modelli Linguistici

Nuovo metodo migliora l'accuratezza dell'ASR usando modelli linguistici per trascrizioni migliori.

2025-06-21T20:33:15+00:00 ― 4 leggere min

Calcolo e linguaggio Migliorare l'accuratezza del tagging degli speaker nelle conversazioni

Un nuovo sistema corregge gli errori di identificazione dell'oratore per trascrizioni di conversazione più chiare.

2025-06-21T18:56:05+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Presentiamo SelectTTS: un metodo semplificato per la sintesi vocale

SelectTTS semplifica la generazione del parlato per relatori mai visti con una selezione di frame efficace.

2025-06-21T18:07:30+00:00 ― 5 leggere min

Suono Sviluppi nelle Tecniche di Miglioramento del Suono

Migliorare la chiarezza del parlato tramite filtri ibridi e reti neurali.

2025-06-21T17:18:55+00:00 ― 5 leggere min

Suono AASIST3: Soluzione Avanzata per Verifica Vocale

AASIST3 migliora il rilevamento delle voci false nei sistemi di verifica automatica del parlante.

2025-06-21T16:30:20+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nella tecnologia audio: ecco X-Codec

X-Codec migliora la generazione audio integrando la comprensione semantica nel processo.

2025-06-21T15:41:45+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Progressi nella tecnologia di riconoscimento dei gesti

I ricercatori migliorano il riconoscimento dei gesti usando tecniche di apprendimento innovative.

2025-06-21T12:27:25+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Controllo del rumore innovativo per i cantieri

Un sistema portatile riduce il rumore in cantiere, migliorando il comfort dei lavoratori e il benessere della comunità.

2025-06-21T11:38:50+00:00 ― 5 leggere min

Suono Progressi nella tecnologia di generazione di musica da testo

Nuovi modelli come FluxMusic migliorano la creazione musicale a partire da testi scritti.

2025-06-21T10:50:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Combinare Voce e Viso per Riconoscere Meglio l'Identità

Questo articolo parla dei benefici di unire i sistemi di riconoscimento vocale e facciale.

2025-06-21T08:24:30+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia di riconoscimento vocale audio-visivo

Un nuovo modello migliora il riconoscimento vocale combinando in modo efficace input audio e visivi.

2025-06-21T05:58:45+00:00 ― 5 leggere min

Suono Avanzando nella rilevazione della depressione attraverso l'analisi del parlato

Nuovi modelli migliorano la precisione nel rilevare la depressione tramite registrazioni vocali.

2025-06-21T03:33:00+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel Self-Supervised Learning per l'elaborazione del parlato

Un nuovo metodo migliora le prestazioni del modello di linguaggio in vari compiti.

2025-06-21T02:44:25+00:00 ― 6 leggere min

Suono Avanzare nel riconoscimento delle parole chiave con dati non etichettati

Un nuovo metodo migliora l'accuratezza del riconoscimento delle parole chiave usando dati audio non etichettati.

2025-06-21T01:55:50+00:00 ― 7 leggere min

Neuroni e cognizione Rilevamento automatico del lieve deterioramento cognitivo tramite analisi del parlato

La ricerca mostra che l'analisi del linguaggio può aiutare nella rilevazione precoce del lieve deterioramento cognitivo.

2025-06-21T01:11:33+00:00 ― 5 leggere min

Suono Progressi nella Generazione Automatica di Musica

Un nuovo metodo migliora la generazione musicale concentrandosi sugli accordi e sulla rappresentazione.

2025-06-20T23:30:05+00:00 ― 7 leggere min

Suono Nuovo dataset migliora la tecnologia di riconoscimento vocale

I ricercatori hanno creato LibriheavyMix per migliorare il riconoscimento vocale in ambienti rumorosi.

2025-06-20T22:41:30+00:00 ― 5 leggere min

Suono Progressi nel riconoscimento vocale multi-parlante

Nuovi metodi migliorano il riconoscimento vocale in situazioni difficili con più parlanti.

2025-06-20T21:52:55+00:00 ― 5 leggere min

Elaborazione del segnale Nuovo dataset punta a trasformare la diagnosi delle malattie cardiache

Un dataset rivoluzionario potenzia gli strumenti AI per diagnosticare le malattie cardiache.

2025-06-20T21:04:20+00:00 ― 7 leggere min

Suono VoxHakka: Salvare l'Hakka taiwanese con la tecnologia

Un nuovo sistema aiuta a far rivivere la lingua Hakka taiwanese.

2025-06-20T16:12:50+00:00 ― 6 leggere min

Suono Sviluppi nelle tecniche di miglioramento del suono

Nuovi metodi migliorano la chiarezza del parlato in ambienti rumorosi usando tecnologie avanzate.

2025-06-20T15:24:15+00:00 ― 5 leggere min

Suono Sviluppi nella tecnologia di estrazione del parlante target

Nuovi metodi migliorano la separazione vocale in ambienti rumorosi.

2025-06-20T13:47:05+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il TTS per lingue a bassa risorsa

Questo articolo esplora metodi per migliorare i sistemi di sintesi vocale per lingue poco rappresentate.

2025-06-20T10:32:45+00:00 ― 7 leggere min

Suono Melodie tra le culture: un tuffo profondo

Questo studio esamina come la melodia varia e si collega tra diverse culture.

2025-06-20T06:00:33+00:00 ― 7 leggere min

Suono ConversaSynth: Avanzando Conversazioni Audio Sintetiche

Un framework che usa modelli di linguaggio grandi per creare dialoghi audio autentici.

2025-06-20T05:41:15+00:00 ― 6 leggere min

Calcolo e linguaggio Progressi nella Tokenizzazione del Parlato: Un Quadro per la Valutazione

Un nuovo benchmark aiuta a valutare i tokenizer vocali per migliorare le prestazioni.

2025-06-20T00:01:10+00:00 ― 6 leggere min