Articoli più recenti per Riconoscimento vocale

Suono Progressi nel Ripristino del Parlato: MaskSR2

MaskSR2 migliora la chiarezza e la qualità del parlato usando tecniche innovative.

2025-06-11T07:06:40+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale con il rilevamento delle disfluenze

Un nuovo metodo migliora i sistemi di riconoscimento vocale rilevando le interruzioni nel parlato.

2025-06-11T05:08:42+00:00 ― 7 leggere min

Informatica neurale ed evolutiva Progressi nelle Reti Neurali a Spike con Circuiti Analogici

Un nuovo sistema sfrutta le reti neurali a impulsi per un'elaborazione dei dati più efficiente.

2025-06-10T22:33:42+00:00 ― 6 leggere min

Calcolo e linguaggio Sviluppi nei sistemi di traduzione vocale multilingue

Nuovi metodi migliorano l'accuratezza e l'efficienza della traduzione per più lingue.

2025-06-10T16:14:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Sfide e Progressi nel Riconoscimento delle Parole Chiave per l'Urdu

Una panoramica sulle tecnologie di riconoscimento delle parole chiave e le loro sfide con la lingua urdu.

2025-06-10T10:52:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Scelte di design che influenzano le prestazioni del modello di parola

Uno studio su come le scelte di design influenzano i modelli di linguaggio.

2025-06-10T06:00:35+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale per gli accenti

Questo articolo parla di metodi per migliorare il riconoscimento vocale per il parlato con accenti.

2025-06-08T12:42:50+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare i modelli audio linguistici per il tailandese e l'inglese

Questo studio affronta le sfide nei modelli audio per le lingue a basso supporto.

2025-06-08T08:39:55+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare i sistemi TTS per le lingue indiane

Migliorare la sintesi vocale nelle lingue indiane usando unità inter-pausali.

2025-06-08T02:59:50+00:00 ― 7 leggere min

Suono Avanzando il Riconoscimento Vocale Automatico con CADA-GAN

CADA-GAN migliora le performance dei sistemi ASR in vari ambienti di registrazione.

2025-06-07T23:45:30+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nel riconoscimento vocale audio-visivo

Llama-AVSR unisce audio e input visivi per migliorare l'accuratezza del riconoscimento vocale.

2025-06-07T18:05:25+00:00 ― 7 leggere min

Suono Sviluppi nei sistemi di feedback per l'apprendimento delle lingue

Un nuovo metodo utilizza l'ombreggiatura virtuale per migliorare il feedback sulla pronuncia degli studenti di lingue.

2025-06-07T05:56:40+00:00 ― 6 leggere min

Apprendimento automatico Progressi nel riconoscimento vocale per bambini

Un nuovo metodo ASR aiuta la tecnologia a capire meglio il linguaggio dei bambini.

2025-06-06T20:13:40+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Nuovo sistema combina suono e visione per il riconoscimento degli oggetti

YOSS usa audio per migliorare l'identificazione degli oggetti nelle immagini.

2025-06-05T10:22:06+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Costruire Dataset di Parlato Migliori per Lingue Sottovalutate

Un progetto che sviluppa dataset di parlato e testo per lingue con risorse limitate.

2025-06-04T06:41:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la verifica dell'oratore con CA-MHFA

Un nuovo framework migliora il riconoscimento vocale e si adatta a vari compiti di parlato.

2025-06-04T05:52:45+00:00 ― 4 leggere min

Calcolo e linguaggio Sviluppi nelle Tecniche di Elaborazione del Parlato Senza Testo

Nuovi metodi migliorano il riconoscimento vocale per lingue a bassa risorsa senza testo.

2025-06-03T18:32:35+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il Riconoscimento Vocale con Tecniche Fonetiche

Nuovi metodi migliorano l'accuratezza nei sistemi di riconoscimento vocale usando la comprensione fonetica.

2025-06-03T16:55:25+00:00 ― 6 leggere min

Suono Migliorare il riconoscimento vocale con caratteristiche ispirate all'uomo

Nuove caratteristiche acustiche migliorano le prestazioni dei sistemi ASR in ambienti rumorosi.

2025-06-03T14:29:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Whisper-Medusa: Migliorare l'Efficienza del Riconoscimento Vocale

Nuovo modello raggiunge trascrizione vocale più veloce senza sacrificare l'accuratezza.

2025-06-03T00:43:45+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Embeddings del Parlatore Matryoshka: Un Approccio Flessibile al Riconoscimento Vocale

Scopri come gli embedding Matryoshka migliorano l'efficienza e la flessibilità nel riconoscimento vocale.

2025-06-02T20:40:50+00:00 ― 5 leggere min

Suono Sviluppi nell'adattamento del testo in voce

Il nuovo modello VoiceGuider migliora il TTS per relatori diversi.

2025-06-02T19:03:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nella tecnologia di riconoscimento vocale

Un nuovo metodo migliora il riconoscimento vocale per registrazioni lunghe.

2025-05-30T21:54:17+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nei modelli di linguaggio parlato senza bisogno di tanti dati di addestramento

Nuovo metodo per i modelli di linguaggio parla riduce la necessità di dati estesi.

2025-05-29T17:50:26+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato L'evoluzione della diarizzazione degli oratori

Come i nuovi metodi stanno trasformando l'identificazione degli oratori nelle registrazioni audio.

2025-05-25T18:57:25+00:00 ― 6 leggere min

Suono Estrazione del Parlatore Target: Migliorare la Chiarezza in Ambienti Rumorosi

Scopri come TSE migliora il riconoscimento vocale in ambienti affollati usando indizi testuali.

2025-05-25T00:14:51+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Utilizzare Assistenti Vocali per Rilevare un Lieve Impairment Cognitivo

Gli assistenti vocali aiutano a identificare i primi segnali di problemi di memoria negli anziani.

2025-05-24T01:31:44+00:00 ― 7 leggere min

Suono Mamba: Avanzando la tecnologia di riconoscimento vocale

Mamba migliora il riconoscimento vocale con velocità e precisione, cambiando il modo di interagire con i dispositivi.

2025-05-19T22:39:54+00:00 ― 4 leggere min

Suono Usare segnali visivi per capire meglio il parlato nel rumore

Un nuovo metodo migliora la chiarezza del parlato usando informazioni visive dall'ambiente circostante.

2025-05-18T20:42:14+00:00 ― 5 leggere min

Suono SAMOS: Migliorare la Valutazione della Qualità del Parlato

SAMOS offre un modo nuovo per misurare la qualità del parlato, migliorando la naturalezza.

2025-05-11T19:57:24+00:00 ― 6 leggere min

Suono Tiny-Align: Un Nuovo Approccio agli Assistenti Vocali

Tiny-Align migliora gli assistenti vocali per una migliore interazione personale su dispositivi piccoli.

2025-05-07T01:43:40+00:00 ― 6 leggere min

Apprendimento automatico VQalAttent: Un Nuovo Approccio alla Generazione del Parlato

Presentiamo VQalAttent, un modello più semplice per generare discorsi macchina realistici.

2025-05-05T05:35:38+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato United-MedASR: Migliorare il Riconoscimento Vocale Medico

Un nuovo sistema ASR migliora il riconoscimento vocale medico per una cura precisa dei pazienti.

2025-04-30T00:58:50+00:00 ― 6 leggere min

Suono Rilevare Deepfake: Il Ruolo dei Modelli ASR

Esplorando come i modelli ASR aiutano a identificare efficacemente i deepfake vocali.

2025-04-24T01:54:40+00:00 ― 7 leggere min

Calcolo e linguaggio Un nuovo metodo per il riconoscimento vocale attribuito agli speaker

Tiene un modo efficiente per tenere traccia dei relatori in contesti multilingue usando il riconoscimento vocale automatico.

2025-04-20T15:33:18+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Avanzare nel Riconoscimento Vocale per la Disfluenza

Migliorare la trascrizione automatica per capire meglio i disturbi del linguaggio.

2025-04-17T08:35:42+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale con il Pinyin

Nuovo modello migliora significativamente l'accuratezza del riconoscimento vocale cinese.

2025-04-15T08:10:03+00:00 ― 6 leggere min

Suono Presentiamo Noro: Un sistema di conversione vocale affidabile

Noro migliora la conversione vocale, rendendola efficace anche in ambienti rumorosi.

2025-04-15T07:14:42+00:00 ― 6 leggere min

Calcolo e linguaggio GLM-4-Voice: Il Prossimo Passo nei Chatbot

Un nuovo chatbot che offre conversazioni simili a quelle umane con consapevolezza emotiva.

2025-04-02T18:12:36+00:00 ― 3 leggere min

Calcolo e linguaggio Trasformare il riconoscimento vocale: nuovi metodi di valutazione

Scopri come la valutazione indipendente dallo stile migliora i sistemi di Riconoscimento Automatico del Parlato.

2025-03-26T13:05:15+00:00 ― 7 leggere min