Articoli più recenti per Elaborazione del parlato

Elaborazione dell'audio e del parlato Innovazioni nella scoperta di termini parlati con DUSTED

DUSTED migliora l'efficienza nell'identificare le parole parlate analizzando i modelli fonetici.

2025-06-25T02:17:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel Text-to-Speech con DualSpeech

Il modello DualSpeech migliora la chiarezza TTS e la somiglianza con il parlante.

2025-06-24T10:54:10+00:00 ― 6 leggere min

Calcolo e linguaggio Nuovo punto di riferimento per il riconoscimento vocale in hindi

La ricerca migliora il riconoscimento vocale per l'hindi con accenti diversi.

2025-06-24T05:11:42+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nella tecnologia audio: ecco X-Codec

X-Codec migliora la generazione audio integrando la comprensione semantica nel processo.

2025-06-21T15:41:45+00:00 ― 6 leggere min

Suono Sviluppi nei sistemi di riconoscimento delle emozioni vocali

Questo studio migliora la SER grazie a una migliore pre-elaborazione e modelli di attenzione più efficienti.

2025-06-18T12:23:30+00:00 ― 5 leggere min

Calcolo e linguaggio Modelli di Parlato Avanzati con Apprendimento Visivo

La ricerca si concentra sul miglioramento dell'apprendimento delle lingue attraverso modelli di linguaggio legati alla realtà visiva.

2025-06-18T03:42:12+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia di ricostruzione vocale per dispositivi audio indossabili

Nuovi metodi migliorano la chiarezza vocale in ambienti rumorosi per gli auricolari.

2025-06-17T23:26:10+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la qualità del parlato in ambienti rumorosi

Un nuovo metodo migliora la chiarezza vocale in ambienti rumorosi.

2025-06-17T00:45:50+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Nuovo approccio nel riconoscimento delle emozioni nel discorso

Un nuovo metodo combina significato e suono per migliorare il riconoscimento delle emozioni nel parlato.

2025-06-16T16:40:00+00:00 ― 7 leggere min

Suono Sviluppi nella diarisazione degli speaker audio-visivi

Una panoramica dei metodi, delle sfide e dei sistemi di diarizzazione audio-visiva dei relatori.

2025-06-15T21:14:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Valutare il modello Mamba nei compiti di elaborazione del parlato

Questa ricerca analizza le performance di Mamba nei compiti di parola, mettendo in evidenza la ricostruzione e il riconoscimento dei suoni.

2025-06-14T23:22:15+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nella generazione di audio da testo

SSR-Speech offre nuove soluzioni per la generazione e la modifica del parlato.

2025-06-14T16:05:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Acoustic Landmarks: Un Nuovo Dataset per l'Elaborazione del Parlato

I ricercatori sviluppano un dataset per migliorare le tecniche di riconoscimento e analisi vocale.

2025-06-13T19:50:25+00:00 ― 6 leggere min

Suono Comprendere il riconoscimento delle emozioni nel parlato

Uno studio che svela come i modelli di deep learning riconoscono le emozioni nel parlato.

2025-06-11T16:01:05+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la verifica vocale con la tecnica IML-KD

Un nuovo metodo migliora il riconoscimento vocale delle macchine per la verifica dell'oratore.

2025-06-11T09:32:25+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare l'interazione uomo-robot attraverso il riconoscimento delle emozioni

Lo studio mette in evidenza i progressi nel riconoscimento delle emozioni nei robot usando i Vision Transformers.

2025-06-10T02:46:15+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel riconoscimento vocale per scenari con più parlanti

Un nuovo framework semplifica il riconoscimento vocale in ambienti affollati.

2025-06-07T20:31:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzando nel trattamento del linguaggio con coerenza nella ricostruzione di fase

Una nuova funzione di perdita migliora la qualità audio allineando fase e ampiezza.

2025-06-03T12:03:55+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nei Codec Neurali con ESPnet-Codec

ESPnet-Codec migliora l'addestramento e la valutazione dei codec neurali per audio e parlato.

2025-06-03T03:09:30+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Avanzare nell'apprendimento multi-task nei modelli di parlato

Un nuovo metodo migliora l'elaborazione del parlato e dell'audio in diversi compiti.

2025-06-02T10:57:50+00:00 ― 6 leggere min

Suono Integrazione di dati audio-visivi per l'elaborazione del parlato

Questo studio analizza come audio, video e testo lavorano insieme nel riconoscimento vocale.

2025-05-30T15:13:22+00:00 ― 7 leggere min

Suono Sviluppi nella tecnologia di riconoscimento delle emozioni nei parlanti

Esplorare nuovi metodi per riconoscere le emozioni nel parlato usando modelli avanzati.

2025-05-24T20:14:18+00:00 ― 8 leggere min

Calcolo e linguaggio Analisi Topologica dei Dati nell'elaborazione del Linguaggio Naturale

Scopri come il TDA migliora la comprensione nell'analisi del linguaggio.

2025-05-22T13:35:24+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Identificare la fonte del discorso falso

Un nuovo metodo mira a rilevare l'origine delle voci sintetiche.

2025-05-03T14:39:08+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella separazione vocale con Codecformer-EL

Nuovi metodi migliorano la separazione del parlato usando codec audio neurali per una comunicazione più chiara.

2025-04-26T00:20:40+00:00 ― 9 leggere min

Calcolo e linguaggio Sviluppi nella tecnologia di riconoscimento vocale

Nuovi metodi migliorano il riconoscimento vocale mantenendo le conoscenze passate.

2025-04-21T11:17:42+00:00 ― 5 leggere min

Suono Progressi nel Riconoscimento Vocale Automatico

Nuovi metodi migliorano il modo in cui le macchine riconoscono il linguaggio parlato.

2025-04-20T10:37:12+00:00 ― 8 leggere min

Suono Il Futuro del Voice Cloning: Una Nuova Era

La tecnologia del cloning vocale sta facendo progressi, creando discorsi realistici che imitano la conversazione umana.

2025-04-11T04:32:42+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Preservare l'accento sillabico in ambienti rumorosi

La ricerca esplora come i modelli di miglioramento del parlato mantengono l'accento delle sillabe nonostante il rumore.

2025-03-07T10:31:48+00:00 ― 6 leggere min

Suono Potenziare l'estrazione del parlante target con nuovi dati

I ricercatori migliorano l'elaborazione del parlato usando Libri2Vox e tecniche di dati sintetici.

2025-02-23T07:21:54+00:00 ― 6 leggere min

Suono Portare il doppiaggio in vita: migliorare la sincronizzazione labiale

Un nuovo metodo migliora la sincronizzazione labiale nei video doppiati per un'esperienza di visione più naturale.

2025-02-03T03:44:06+00:00 ― 7 leggere min