I ricercatori migliorano il riconoscimento del parlato generato da macchine usando aggiustamenti delle informazioni di fase.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
I ricercatori migliorano il riconoscimento del parlato generato da macchine usando aggiustamenti delle informazioni di fase.
― 6 leggere min
Un nuovo framework migliora lo studio dei sistemi di riconoscimento vocale non supervisionati.
― 7 leggere min
Il nuovo modello LinDiff migliora la velocità e la qualità della sintesi vocale.
― 5 leggere min
I ricercatori mescolano caratteristiche visive e sonore per migliorare il linguaggio per gli utenti di elettrolaringe.
― 5 leggere min
Questa ricerca mette in evidenza come i LLM migliorano la comprensione del parlato nei video lunghi.
― 4 leggere min
Un nuovo metodo ottimizza i modelli vocali per migliori prestazioni con meno risorse.
― 5 leggere min
EM-Network migliora l'apprendimento delle sequenze nei compiti di elaborazione del parlato e del linguaggio.
― 5 leggere min
Questo studio valuta vari modelli per prevedere la qualità del parlato sintetizzato.
― 6 leggere min
Questo articolo parla di come migliorare il riconoscimento vocale usando metodi di ensemble basati sulla fiducia.
― 5 leggere min
GenerTTS migliora la tecnologia di sintesi vocale per applicazioni multilingue.
― 5 leggere min
Un nuovo modello migliora l'estrazione del parlato da sfondi rumorosi usando il deep learning.
― 5 leggere min
Uno studio su come migliorare la riproduzione del suono vocale attraverso tecniche di sintesi avanzate.
― 6 leggere min
Nuovi metodi mirano a nascondere le identità degli speakers mantenendo la chiarezza del discorso.
― 5 leggere min
Un nuovo metodo per migliorare la qualità del discorso usando reti a basso consumo energetico.
― 5 leggere min
I ricercatori analizzano come le emozioni vengono condivise attraverso il linguaggio usando dati vari.
― 6 leggere min
Nuovi metodi migliorano la qualità della voce sintetizzata usando l'apprendimento auto-supervisionato.
― 5 leggere min
L'apprendimento federato migliora il riconoscimento vocale mantenendo i dati dell'utente privati.
― 6 leggere min
Un nuovo metodo migliora il rilevamento delle emozioni dalla voce usando solo l'audio.
― 5 leggere min
O-1 migliora il riconoscimento vocale ottimizzando i metodi di auto-apprendimento.
― 5 leggere min
Le ricerche evidenziano metodi di rilevamento in tempo reale per audio fasullo creato dall'IA.
― 6 leggere min
Nuovi metodi di potatura migliorano le prestazioni del modello text-to-speech multi-parlante zero-shot.
― 7 leggere min
Nuovi metodi per selezionare dati vocali riducono il labeling mentre migliorano la precisione del riconoscimento.
― 5 leggere min
Un nuovo metodo migliora il ranking della qualità del parlato usando i punteggi di preferenza degli ascoltatori.
― 5 leggere min
Un metodo per migliorare i sistemi ASR per utenti che balbettano.
― 5 leggere min
Nuovi metodi a passaggio singolo migliorano la precisione nel tracciamento dei formanti per i suoni della parola.
― 4 leggere min
Un nuovo approccio migliora l'integrazione del parlato con i modelli di linguaggio.
― 7 leggere min
Esaminare come i modelli di linguaggio pre-addestrati migliorano la qualità del testo in voce.
― 6 leggere min
MuLanTTS di Microsoft offre capacità di sintesi vocale francese naturali ed espressive.
― 5 leggere min
Un progetto punta a migliorare l'elaborazione del parlato francese usando l'apprendimento auto-supervisionato.
― 5 leggere min
Nuovi metodi migliorano il modo in cui le macchine riconoscono il ritmo della parola e le emozioni.
― 6 leggere min
Questo studio migliora la capacità dei sistemi ASR di riconoscere il parlato dei bambini.
― 6 leggere min
VoxtLM combina riconoscimento vocale, sintesi, generazione di testo e continuazione in un unico modello.
― 4 leggere min
Libriheavy offre 50.000 ore di inglese parlato per potenziare la tecnologia di riconoscimento vocale.
― 5 leggere min
AV2Wav migliora la qualità del parlato usando segnali audio e visivi.
― 5 leggere min
La selezione di core-set migliora i modelli di sintesi vocale concentrandosi su dati diversi.
― 6 leggere min
Nuovo metodo conserva il tono emotivo nella conversione della voce per una migliore interazione uomo-computer.
― 6 leggere min
Le ricerche mostrano che il discorso emotivo influisce sulle performance dei modelli nei compiti di separazione del parlato.
― 7 leggere min
La ricerca combina l'apprendimento auto-supervisionato e nuove tecniche di misurazione per migliorare l'inversione vocale.
― 6 leggere min
I ricercatori hanno sviluppato un nuovo framework per migliorare la chiarezza del parlato per gli utenti di elettrolaringei.
― 5 leggere min
Un nuovo metodo utilizza dati sintetici per migliorare i sistemi ASR in aree poco familiari.
― 7 leggere min