Articoli più recenti per Tecnologia del parlato

Elaborazione dell'audio e del parlato Valutare i modelli di sintesi vocale con misurazioni di ranking

Un nuovo metodo valuta i modelli di parlato self-supervised usando misure di ranking.

2025-06-10T05:12:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la Chiarezza del Parlato con il Modello MCMamba

Il modello MCMamba migliora la qualità del parlato in ambienti rumorosi usando informazioni spaziali e spettrali.

2025-06-09T21:54:45+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Progressi nel riconoscimento vocale grazie a un pensiero simile a quello umano

Un nuovo framework migliora il riconoscimento vocale modellando efficacemente le relazioni sonore.

2025-06-09T07:20:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il rilevamento delle imitazioni vocali con metodi spiegabili

Un nuovo approccio migliora l'interpretabilità del rilevamento di discorso falsificato.

2025-06-08T11:05:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia vocale multilingue

Un modello migliora i compiti di parlare in contesti multilingue, affrontando le sfide del code-switching.

2025-06-08T06:14:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato EVA: Una Nuova Era nel Riconoscimento Vocale Audiovisivo

EVA unisce segnali audio e visivi per una migliore precisione nel riconoscimento vocale.

2025-06-07T22:08:20+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzare il riconoscimento vocale con tecniche implicite

Un nuovo metodo migliora le interazioni vocali integrando i processi di riconoscimento e risposta.

2025-06-06T03:21:12+00:00 ― 5 leggere min

Calcolo e linguaggio Unire Modelli di Parole e Linguaggio per Migliori Prestazioni

La ricerca valuta i collegamenti tra modelli di linguaggio e modelli di parola per migliorare il riconoscimento e la traduzione.

2025-06-05T22:13:06+00:00 ― 5 leggere min

Calcolo e linguaggio Metodi innovativi per il riconoscimento vocale con dati limitati

Scopri come allenare efficacemente modelli di linguaggio con meno risorse etichettate.

2025-06-05T19:07:35+00:00 ― 7 leggere min

Calcolo e linguaggio Rivalutare il genere nella ricerca sulla tecnologia del linguaggio

Un'analisi della terminologia di genere nella tecnologia vocale e le sue implicazioni sociali.

2025-06-05T15:53:15+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Valutare i codec audio neurali: intuizioni dalla sfida Codec-SUPERB

Uno sguardo ai risultati della sfida Codec-SUPERB e ai metodi di misurazione delle performance del codec.

2025-06-05T06:58:50+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare i Metodi di Formazione per la Traduzione del Discorso Diretto

Questo articolo parla di nuove strategie per addestrare in modo efficace i sistemi di traduzione vocale.

2025-06-05T03:55:00+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Presentiamo EMOVA: L'Assistente Vocale Emozionale

EMOVA migliora l'interazione tra umani e computer attraverso l'espressione emotiva.

2025-06-05T03:47:06+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Combinare segnali audio e visivi per un parlato più chiaro

Nuovo metodo migliora la chiarezza del parlato integrando informazioni visive.

2025-06-04T22:53:00+00:00 ― 5 leggere min

Suono Sviluppi nella conversione vocale multilingue

Un metodo innovativo per convertire voci tra lingue mantenendo caratteristiche uniche.

2025-06-02T15:49:20+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nel trasferimento di stile da testo a voce

Nuove tecniche migliorano la qualità della voce espressiva tra diversi oratori.

2025-06-02T15:00:45+00:00 ― 6 leggere min

Suono Affrontare la sfida della rilevazione del parlato falso

La ricerca si concentra sul miglioramento dei metodi per rilevare il discorso falso realistico.

2025-06-01T09:51:45+00:00 ― 5 leggere min

Calcolo e linguaggio Ripristinare il linguaggio tramite la tecnologia dei segnali muscolari

La ricerca punta ad aiutare le persone a riprendere a parlare usando i segnali muscolari.

2025-05-31T18:11:18+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare la valutazione della qualità del parlato con consapevolezza del rumore

Un nuovo approccio migliora la valutazione della qualità del parlato tenendo conto del rumore di fondo.

2025-05-24T12:13:12+00:00 ― 6 leggere min

Calcolo e linguaggio SLAM-ASR: Uno Sguardo al Potenziale del Riconoscimento Vocale

Esaminando i punti di forza, le debolezze e il futuro dello SLAM-ASR nel riconoscimento vocale.

2025-05-23T14:50:16+00:00 ― 5 leggere min

Apprendimento automatico Avanzando il riconoscimento dei confini delle parole nell'elaborazione del parlato

Un nuovo metodo migliora la capacità delle macchine di rilevare i confini delle parole nel parlato.

2025-05-22T16:12:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Affrontare la sfida del discorso falso

Nuovi modelli migliorano il riconoscimento delle voci false nella tecnologia del parlato.

2025-05-13T05:42:22+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzando nella ricerca vocale con il metodo BEST-STD

I ricercatori migliorano il rilevamento vocale per ricerche vocali più veloci e precise.

2025-05-03T22:26:26+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia di riconoscimento vocale in streaming

Nuovi metodi stanno migliorando significativamente l'accuratezza del riconoscimento vocale in tempo reale.

2025-04-24T09:39:00+00:00 ― 5 leggere min

Calcolo e linguaggio Iniziare a spaccare nel sintetizzatore vocale

Uno sguardo alla generazione di parlato senza testo usando nuovi metodi audio.

2025-03-28T19:46:12+00:00 ― 6 leggere min

Suono Progressi nella tecnologia Text-to-Speech

Scopri come i sistemi TTS stanno evolvendo per suonare più simili agli esseri umani.

2025-03-06T09:51:18+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Potenziare il recupero di informazioni vocali con SPIRAL

Nuovi metodi aiutano le macchine a trovare informazioni chiave dai contenuti parlati.

2025-02-21T15:53:06+00:00 ― 6 leggere min

Calcolo e linguaggio Trasformare la sintesi vocale conversazionale

Nuovi metodi migliorano il dialogo naturale nella tecnologia vocale.

2025-01-27T08:52:48+00:00 ― 6 leggere min

Suono Incontra U-Mamba-Net: Il Futuro della Separazione del Parole

Un modello leggero progettato per separare in modo efficace il parlato misto in ambienti rumorosi.

2025-01-25T12:27:54+00:00 ― 6 leggere min

Suono Le macchine imparano le emozioni attraverso i movimenti della bocca

Un nuovo approccio nel riconoscimento delle emozioni si concentra sui movimenti della bocca invece che sui suoni.

2025-01-20T23:53:42+00:00 ― 6 leggere min