Articoli più recenti per Tecnologia del parlato

Suono Avanzamenti nei sistemi di contromisure vocali

I ricercatori migliorano il riconoscimento del parlato generato da macchine usando aggiustamenti delle informazioni di fase.

2025-10-26T17:55:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nel riconoscimento vocale non supervisionato

Un nuovo framework migliora lo studio dei sistemi di riconoscimento vocale non supervisionati.

2025-10-25T13:34:45+00:00 ― 7 leggere min

Suono LinDiff: Un Salto Avanti nella Sintesi Vocale

Il nuovo modello LinDiff migliora la velocità e la qualità della sintesi vocale.

2025-10-25T00:37:25+00:00 ― 5 leggere min

Suono Avanzamenti innovativi nella tecnologia del parlato elettrolaringeo

I ricercatori mescolano caratteristiche visive e sonore per migliorare il linguaggio per gli utenti di elettrolaringe.

2025-10-24T12:28:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con grandi modelli di linguaggio

Questa ricerca mette in evidenza come i LLM migliorano la comprensione del parlato nei video lunghi.

2025-10-23T22:42:45+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Gestione Efficiente di Grandi Modelli di Voce

Un nuovo metodo ottimizza i modelli vocali per migliori prestazioni con meno risorse.

2025-10-23T21:54:10+00:00 ― 5 leggere min

Apprendimento automatico EM-Network: Un Nuovo Approccio nell'Apprendimento delle Sequenze

EM-Network migliora l'apprendimento delle sequenze nei compiti di elaborazione del parlato e del linguaggio.

2025-10-23T07:19:40+00:00 ― 5 leggere min

Suono Valutare la qualità del parlato con modelli di machine learning

Questo studio valuta vari modelli per prevedere la qualità del parlato sintetizzato.

2025-10-21T16:27:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale tramite ensemble basati sulla fiducia

Questo articolo parla di come migliorare il riconoscimento vocale usando metodi di ensemble basati sulla fiducia.

2025-10-16T18:14:30+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzando il Text-to-Speech: Modello GenerTTS Spiegato

GenerTTS migliora la tecnologia di sintesi vocale per applicazioni multilingue.

2025-10-16T15:48:45+00:00 ― 5 leggere min

Suono Tecnologia Avanzata di Isolamento Vocale

Un nuovo modello migliora l'estrazione del parlato da sfondi rumorosi usando il deep learning.

2025-10-16T02:02:50+00:00 ― 5 leggere min

Suono Sviluppi nella sintesi vocale articolatoria

Uno studio su come migliorare la riproduzione del suono vocale attraverso tecniche di sintesi avanzate.

2025-10-11T02:12:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nelle tecniche di anonimizzazione degli speaker

Nuovi metodi mirano a nascondere le identità degli speakers mantenendo la chiarezza del discorso.

2025-10-08T01:20:00+00:00 ― 5 leggere min

Suono Progressi nel miglioramento del parlato con reti neurali a impulsi

Un nuovo metodo per migliorare la qualità del discorso usando reti a basso consumo energetico.

2025-10-03T21:44:15+00:00 ― 5 leggere min

Intelligenza artificiale Misurare le Emozioni nel Parlar: Un Nuovo Approccio

I ricercatori analizzano come le emozioni vengono condivise attraverso il linguaggio usando dati vari.

2025-10-03T09:07:42+00:00 ― 6 leggere min

Calcolo e linguaggio Progressi nella tecnologia Text-to-Speech

Nuovi metodi migliorano la qualità della voce sintetizzata usando l'apprendimento auto-supervisionato.

2025-09-30T17:37:25+00:00 ― 5 leggere min

Suono Avanzare il riconoscimento vocale con l'apprendimento federato

L'apprendimento federato migliora il riconoscimento vocale mantenendo i dati dell'utente privati.

2025-09-30T08:43:00+00:00 ― 6 leggere min

Calcolo e linguaggio EmoDistill: Avanzando nel Riconoscimento delle Emozioni nel Parlato

Un nuovo metodo migliora il rilevamento delle emozioni dalla voce usando solo l'audio.

2025-09-28T23:55:36+00:00 ― 5 leggere min

Apprendimento automatico O-1: Una Nuova Frontiera nell'Addestramento al Riconoscimento Vocale

O-1 migliora il riconoscimento vocale ottimizzando i metodi di auto-apprendimento.

2025-09-26T09:10:10+00:00 ― 5 leggere min

Suono Nuovo studio sulla rilevazione del linguaggio generato dall'IA

Le ricerche evidenziano metodi di rilevamento in tempo reale per audio fasullo creato dall'IA.

2025-09-21T19:02:50+00:00 ― 6 leggere min

Suono Migliorare la Sintesi Vocale con Tecniche di Potatura

Nuovi metodi di potatura migliorano le prestazioni del modello text-to-speech multi-parlante zero-shot.

2025-09-20T15:31:00+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Progressi nell'Apprendimento Autosupervisionato per il Riconoscimento Vocale

Nuovi metodi per selezionare dati vocali riducono il labeling mentre migliorano la precisione del riconoscimento.

2025-09-20T13:53:50+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la Valutazione della Qualità del Parlato con Punteggi di Preferenza

Un nuovo metodo migliora il ranking della qualità del parlato usando i punteggi di preferenza degli ascoltatori.

2025-09-20T07:25:10+00:00 ― 5 leggere min

Suono Migliorare il riconoscimento vocale per chi balbetta

Un metodo per migliorare i sistemi ASR per utenti che balbettano.

2025-09-20T06:36:35+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nel tracciamento dei formanti per l'elaborazione del parlato

Nuovi metodi a passaggio singolo migliorano la precisione nel tracciamento dei formanti per i suoni della parola.

2025-09-19T02:16:10+00:00 ― 4 leggere min

Calcolo e linguaggio Collegare il discorso con i modelli di linguaggio: il metodo BLSP

Un nuovo approccio migliora l'integrazione del parlato con i modelli di linguaggio.

2025-09-18T15:44:35+00:00 ― 7 leggere min

Calcolo e linguaggio Il Ruolo dei Modelli Linguistici Preaddestrati nel TTS

Esaminare come i modelli di linguaggio pre-addestrati migliorano la qualità del testo in voce.

2025-09-17T20:18:35+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato MuLanTTS: Una Nuova Frontiera nel Testo-in-Parola

MuLanTTS di Microsoft offre capacità di sintesi vocale francese naturali ed espressive.

2025-09-15T22:57:55+00:00 ― 5 leggere min

Calcolo e linguaggio Progressi nell'Apprendimento Auto-Supervisionato per le Tecnologie Vocali Francesi

Un progetto punta a migliorare l'elaborazione del parlato francese usando l'apprendimento auto-supervisionato.

2025-09-14T12:57:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nell'Annotazione Automatica della Prosodia

Nuovi metodi migliorano il modo in cui le macchine riconoscono il ritmo della parola e le emozioni.

2025-09-14T12:08:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nel riconoscimento vocale per i bambini

Questo studio migliora la capacità dei sistemi ASR di riconoscere il parlato dei bambini.

2025-09-14T02:25:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato VoxtLM: Un Approccio Unificato a Voce e Testo

VoxtLM combina riconoscimento vocale, sintesi, generazione di testo e continuazione in un unico modello.

2025-09-13T11:02:45+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Libriheavy: Un Nuovo Dataset per il Riconoscimento Vocale

Libriheavy offre 50.000 ore di inglese parlato per potenziare la tecnologia di riconoscimento vocale.

2025-09-12T18:51:05+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la chiarezza del parlato con la tecnologia AV2Wav

AV2Wav migliora la qualità del parlato usando segnali audio e visivi.

2025-09-12T17:13:55+00:00 ― 5 leggere min

Suono Ottimizzare il Text-to-Speech con la selezione del Core-Set

La selezione di core-set migliora i modelli di sintesi vocale concentrandosi su dati diversi.

2025-09-12T08:19:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Emo-StarGAN: Avanzando la tecnologia di conversione vocale

Nuovo metodo conserva il tono emotivo nella conversione della voce per una migliore interazione uomo-computer.

2025-09-11T23:25:05+00:00 ― 6 leggere min

Suono Le sfide emotive mettono alla prova i modelli di separazione del parlato

Le ricerche mostrano che il discorso emotivo influisce sulle performance dei modelli nei compiti di separazione del parlato.

2025-09-11T18:33:35+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Migliorare l'inversione del parlato tramite apprendimento auto-supervisionato

La ricerca combina l'apprendimento auto-supervisionato e nuove tecniche di misurazione per migliorare l'inversione vocale.

2025-09-10T01:15:50+00:00 ― 6 leggere min

Suono Migliorare la chiarezza nella voce elettrolaringea

I ricercatori hanno sviluppato un nuovo framework per migliorare la chiarezza del parlato per gli utenti di elettrolaringei.

2025-09-09T22:50:05+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare i sistemi ASR con dati sintetici

Un nuovo metodo utilizza dati sintetici per migliorare i sistemi ASR in aree poco familiari.

2025-09-09T15:32:50+00:00 ― 7 leggere min