Articoli più recenti per ASR

Crittografia e sicurezza Nuovo metodo di attacco backdoor per grandi modelli di ML

Un approccio efficiente in termini di risorse agli attacchi backdoor sui modelli di machine learning avanzati.

2025-08-07T00:01:36+00:00 ― 6 leggere min

Calcolo e linguaggio Progressi nel Federated Learning per il Riconoscimento Vocale

Sfruttare modelli a uscita anticipata per un federated learning efficiente nei sistemi ASR.

2025-08-06T09:48:24+00:00 ― 9 leggere min

Apprendimento automatico Sviluppi nel Riconoscimento Automático della Voce con Modelli Linguistici di Denoising

I modelli linguistici denoising migliorano la correzione degli errori nei sistemi di riconoscimento vocale usando dati sintetici.

2025-08-03T22:34:10+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Progressi nel miglioramento del parlato con VPIDM

Il nuovo modello VPIDM migliora la chiarezza della voce in ambienti rumorosi.

2025-08-03T16:54:05+00:00 ― 6 leggere min

Robotica Progressi nei robot da scrivania

Uno studio sui robot da scrivania che usano tecnologie di riconoscimento del linguaggio naturale e visivo.

2025-08-03T13:39:45+00:00 ― 13 leggere min

Calcolo e linguaggio Migliorare la stabilità dei modelli linguistici contro gli attacchi

Nuovi metodi migliorano le previsioni dei modelli linguistici sotto diverse condizioni di input.

2025-08-03T07:56:30+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Introducendo il Modello 4D nel Riconoscimento Vocale

Un nuovo modello migliora il riconoscimento vocale usando più metodi di decodifica.

2025-08-01T01:44:35+00:00 ― 7 leggere min

Intelligenza artificiale Nuovo approccio per valutare modelli multilingue

Un metodo fresco per testare la sicurezza del modello linguistico e le abilità multilingue.

2025-07-28T02:37:54+00:00 ― 8 leggere min

Intelligenza artificiale Mitigare gli attacchi backdoor nei modelli linguistici

Una nuova strategia di difesa per i LLM contro gli attacchi backdoor.

2025-07-26T23:22:36+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare la correzione degli errori di parola nei sistemi ASR

Un nuovo metodo combina caratteristiche acustiche e punteggi di fiducia per una correzione degli errori migliore.

2025-07-25T20:45:15+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il Riconoscimento Vocale Cinese Attraverso la Regolarizzazione del Pinyin

Questo studio presenta un dataset e un metodo per migliorare l'accuratezza dell'ASR cinese usando il Pinyin.

2025-07-25T07:47:55+00:00 ― 7 leggere min

Calcolo e linguaggio Avanzare la tecnologia del parlato per l'arabo tunisino

Questo studio valuta la tecnologia vocale in lingue a basso costo come l'arabo tunisino.

2025-07-21T12:18:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Presentiamo Emilia: Un Nuovo Dataset per la Generazione del Discorso

Emilia offre un dataset vario per migliorare i modelli di generazione vocale.

2025-07-20T09:34:45+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il formato dei numeri nei trascritti ASR

Questo articolo parla di modi per migliorare la formattazione delle espressioni numeriche nei trascritti automatici.

2025-07-14T15:55:35+00:00 ― 5 leggere min

Calcolo e linguaggio Sviluppi nella tecnologia di traduzione automatica del parlato

Un nuovo modello punta a migliorare la qualità della traduzione vocale attraverso sistemi integrati.

2025-07-11T02:54:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con la collaborazione dell'AI

I modelli di intelligenza artificiale migliorano l'accuratezza delle conversioni da parlato a testo.

2025-07-07T09:50:10+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale per termini specialistici

La ricerca migliora i sistemi ASR usando modelli linguistici per una maggiore precisione.

2025-07-06T20:41:12+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale con l'apprendimento della rappresentazione del rumore contestuale

Un metodo per migliorare la qualità del riconoscimento vocale in ambienti rumorosi.

2025-07-01T23:28:15+00:00 ― 7 leggere min

Multimedia Avanzamenti nel recupero dei prodotti e-commerce

Un nuovo metodo migliora le ricerche di prodotti attraverso diversi formati multimediali.

2025-07-01T08:45:24+00:00 ― 6 leggere min

Intelligenza artificiale SAGE-RT: Un Nuovo Metodo per la Sicurezza dei Modelli Linguistici

SAGE-RT crea dati sintetici per migliorare le valutazioni di sicurezza dei modelli linguistici.

2025-06-28T06:37:42+00:00 ― 6 leggere min

Suono Progressi nella Valutazione della Qualità Vocale Utilizzando la Tecnologia

Nuovi metodi migliorano le valutazioni della qualità della voce per i pazienti con problemi al sistema vocale.

2025-06-26T07:26:15+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare l'accuratezza del riconoscimento vocale automatico

Uno sguardo alla misurazione dell'accuratezza nei sistemi di riconoscimento vocale con nuovi metodi.

2025-06-22T20:50:45+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il Riconoscimento Vocale Automatico con Modelli Linguistici

Nuovo metodo migliora l'accuratezza dell'ASR usando modelli linguistici per trascrizioni migliori.

2025-06-21T20:33:15+00:00 ― 4 leggere min

Suono Progressi nel riconoscimento vocale multi-parlante

Nuovi metodi migliorano il riconoscimento vocale in situazioni difficili con più parlanti.

2025-06-20T21:52:55+00:00 ― 5 leggere min

Calcolo e linguaggio Usare i dati vocali per la diagnosi dell'autismo

Un nuovo metodo sfrutta i dati vocali per migliorare le valutazioni sull'autismo.

2025-06-19T19:12:12+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il Riconoscimento Automático della Voce con la Modularità

La ricerca sui sistemi ASR modulari punta a migliorare le performance in ambienti rumorosi.

2025-06-16T17:28:35+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel Riconoscimento Vocale con Sortformer

Sortformer integra la diarizzazione degli speaker e l'ASR per migliorare l'elaborazione audio.

2025-06-15T09:05:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale in contesti con più relatori

Un nuovo approccio migliora l'ASR concentrandosi su dettagli specifici del parlante.

2025-06-11T17:38:15+00:00 ― 5 leggere min

Suono ESPnet-EZ: Semplificare lo Sviluppo di Modelli Vocali

Uno strumento facile da usare per perfezionare i modelli di voce senza codice complesso.

2025-06-11T15:12:30+00:00 ― 7 leggere min

Robotica Migliorare il riconoscimento vocale dei robot per una collaborazione migliore

Un nuovo modello aiuta i robot a seguire le istruzioni umane poco chiare in modo più efficace.

2025-06-11T14:53:18+00:00 ― 6 leggere min

Suono Avanzando il Riconoscimento Vocale Automatico con CADA-GAN

CADA-GAN migliora le performance dei sistemi ASR in vari ambienti di registrazione.

2025-06-07T23:45:30+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzare il riconoscimento vocale con tecniche implicite

Un nuovo metodo migliora le interazioni vocali integrando i processi di riconoscimento e risposta.

2025-06-06T03:21:12+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Valutare i codec audio neurali: intuizioni dalla sfida Codec-SUPERB

Uno sguardo ai risultati della sfida Codec-SUPERB e ai metodi di misurazione delle performance del codec.

2025-06-05T06:58:50+00:00 ― 5 leggere min

Calcolo e linguaggio Innovare il riconoscimento vocale per la lingua Malasar

Un progetto migliora il riconoscimento vocale per la lingua Malasar usando risorse in Tamil.

2025-05-23T02:48:37+00:00 ― 5 leggere min

Suono Mamba: Avanzando la tecnologia di riconoscimento vocale

Mamba migliora il riconoscimento vocale con velocità e precisione, cambiando il modo di interagire con i dispositivi.

2025-05-19T22:39:54+00:00 ― 4 leggere min

Calcolo e linguaggio Collegare i dialetti bangla: un approccio unificato

Questo progetto punta a standardizzare i dialetti bangla per una comunicazione più chiara.

2025-05-12T19:19:18+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato United-MedASR: Migliorare il Riconoscimento Vocale Medico

Un nuovo sistema ASR migliora il riconoscimento vocale medico per una cura precisa dei pazienti.

2025-04-30T00:58:50+00:00 ― 6 leggere min

Calcolo e linguaggio Un nuovo metodo per il riconoscimento vocale attribuito agli speaker

Tiene un modo efficiente per tenere traccia dei relatori in contesti multilingue usando il riconoscimento vocale automatico.

2025-04-20T15:33:18+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale con il Pinyin

Nuovo modello migliora significativamente l'accuratezza del riconoscimento vocale cinese.

2025-04-15T08:10:03+00:00 ― 6 leggere min

Calcolo e linguaggio Salvando il neo-aramaico: una lingua in pericolo

Sforzi per documentare e preservare la lingua neo-aramaica in via di estinzione.

2025-04-13T14:26:15+00:00 ― 6 leggere min