Articoli più recenti per Tasso di errore delle parole

Calcolo e linguaggio Progressi nella correzione degli errori di riconoscimento vocale

Nuovi metodi migliorano la precisione nel riconoscimento vocale rumoroso utilizzando modelli linguistici grandi.

2025-08-29T01:48:45+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il Riconoscimento Vocale con Dati Acustici

Un nuovo metodo integra informazioni acustiche nei modelli linguistici per una migliore riconoscimento vocale.

2025-08-25T02:15:55+00:00 ― 9 leggere min

Calcolo e linguaggio Migliorare la trascrizione medica con l'IA

I LLM migliorano la precisione nelle trascrizioni mediche, avvantaggiando la cura dei pazienti.

2025-08-24T16:32:55+00:00 ― 7 leggere min

Interazione uomo-macchina Progressi nelle Interfacce di Parola Silenziosa

Uno sguardo a MONA, un sistema che migliora la comunicazione del parlato silenzioso.

2025-08-20T16:11:30+00:00 ― 5 leggere min

Robotica Migliorare il riconoscimento vocale dei robot in ambienti rumorosi

La ricerca si concentra su come aiutare i robot a capire meglio il linguaggio tra il rumore di fondo.

2025-08-19T22:22:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Valutare il riconoscimento vocale in ambienti rumorosi

Un nuovo benchmark valuta le prestazioni dei sistemi di riconoscimento vocale in mezzo a vari disturbi.

2025-08-19T14:16:50+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale per le lingue a bassa risorsa

Un metodo per migliorare la precisione del riconoscimento vocale nelle lingue kannada e telugu.

2025-08-17T15:19:00+00:00 ― 8 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale in aula con un preaddestramento continuo

Il riconoscimento vocale migliorato per le aule usando tecniche di allenamento avanzate rende l'apprendimento migliore.

2025-08-05T19:06:15+00:00 ― 7 leggere min

Apprendimento automatico Sviluppi nel Riconoscimento Automático della Voce con Modelli Linguistici di Denoising

I modelli linguistici denoising migliorano la correzione degli errori nei sistemi di riconoscimento vocale usando dati sintetici.

2025-08-03T22:34:10+00:00 ― 8 leggere min

Calcolo e linguaggio Avanzando il Riconoscimento Vocale con Codici Specifici per Accenti

Nuovo metodo migliora la gestione degli accenti nei sistemi ASR tramite codici specializzati.

2025-07-22T04:29:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nel riconoscimento vocale automatico in streaming

Il modello XLSR-Transducer è super per la trascrizione in tempo reale con poca roba.

2025-07-21T18:46:40+00:00 ― 5 leggere min

Suono Vulnerabilità nei sistemi di riconoscimento vocale svelata

La ricerca rivela rischi nei modelli di riconoscimento vocale multitasking come Whisper.

2025-07-21T09:52:15+00:00 ― 5 leggere min

Calcolo e linguaggio TokenVerse: Semplificare l'analisi delle conversazioni

TokenVerse semplifica l'analisi delle conversazioni parlate integrando più compiti in un unico modello.

2025-07-21T08:15:05+00:00 ― 6 leggere min

Calcolo e linguaggio LearnerVoice: Potenziamento del Riconoscimento Vocale per gli Studenti di Lingue

Nuovo dataset punta a migliorare il riconoscimento vocale per i parlanti non nativi dell'inglese.

2025-07-21T02:35:00+00:00 ― 6 leggere min

Intelligenza artificiale Adattare la tecnologia OCR per il riconoscimento del testo spagnolo

Un progetto per migliorare il riconoscimento del testo per documenti in spagnolo usando TrOCR.

2025-07-16T15:58:30+00:00 ― 6 leggere min

Suono L'evoluzione dei sistemi di riconoscimento vocale automatico

Uno sguardo ai progressi nelle tecnologie e nei metodi di riconoscimento vocale.

2025-07-15T11:21:35+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il formato dei numeri nei trascritti ASR

Questo articolo parla di modi per migliorare la formattazione delle espressioni numeriche nei trascritti automatici.

2025-07-14T15:55:35+00:00 ― 5 leggere min

Intelligenza artificiale Presentiamo DANIEL: Un Nuovo Approccio al Riconoscimento di Documenti Scritti a Mano

DANIEL integra più tecniche per un'estrazione efficace da documenti scritti a mano.

2025-07-14T08:08:54+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Le Event Cameras Trasformano il Riconoscimento della Lingua dei Segni

Nuove telecamere per eventi migliorano il riconoscimento della lingua dei segni e l'accuratezza della traduzione, migliorando gli strumenti di comunicazione.

2025-07-11T18:39:36+00:00 ― 5 leggere min

Suono L'ascesa del montaggio vocale nei media digitali

Esplora l'importanza crescente dell'editing vocale per i creatori di contenuti.

2025-07-11T00:28:35+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nell'OCR e HWR arabo con Qalam

Qalam offre un riconoscimento migliore per il testo arabo e la scrittura a mano.

2025-07-11T00:21:30+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Migliorare le tecnologie di riconoscimento del parlato sussurrato

Nuovi metodi puntano a migliorare il riconoscimento del linguaggio sussurrato nei sistemi automatici.

2025-07-08T08:30:30+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale con l'apprendimento della rappresentazione del rumore contestuale

Un metodo per migliorare la qualità del riconoscimento vocale in ambienti rumorosi.

2025-07-01T23:28:15+00:00 ― 7 leggere min

Suono Progressi nella tecnologia di conversione vocale zero-shot

Il nuovo modello migliora la conversione vocale, specialmente per il parlato sussurrato e le applicazioni in tempo reale.

2025-06-26T17:57:50+00:00 ― 6 leggere min

Calcolo e linguaggio Il ruolo dell'ASR nella trascrizione in tribunale

Esaminare il riconoscimento vocale automatico nei sistemi giudiziari canadesi e il suo impatto.

2025-06-24T14:48:24+00:00 ― 7 leggere min

Suono StyleSpeech: Il Futuro della Tecnologia Text-to-Speech

StyleSpeech migliora i sistemi TTS catturando le sfumature del linguaggio naturale.

2025-06-24T14:08:30+00:00 ― 6 leggere min

Calcolo e linguaggio Nuovo punto di riferimento per il riconoscimento vocale in hindi

La ricerca migliora il riconoscimento vocale per l'hindi con accenti diversi.

2025-06-24T05:11:42+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare l'accuratezza del riconoscimento vocale automatico

Uno sguardo alla misurazione dell'accuratezza nei sistemi di riconoscimento vocale con nuovi metodi.

2025-06-22T20:50:45+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare l'accuratezza dell'ASR per l'accessibilità

Esaminare le performance del riconoscimento automatico della voce per utenti sordi e ipoudenti.

2025-06-22T01:24:45+00:00 ― 12 leggere min

Calcolo e linguaggio Migliorare il Riconoscimento Vocale Automatico con Modelli Linguistici

Nuovo metodo migliora l'accuratezza dell'ASR usando modelli linguistici per trascrizioni migliori.

2025-06-21T20:33:15+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con l'addestramento aumentato da rumore

Questo studio analizza come il rumore possa migliorare la resilienza nel riconoscimento del parlato di fronte alle sfide.

2025-06-19T14:18:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nella sintesi vocale usando DDSP

Scopri come DDSP migliora l'efficienza e la qualità della sintesi vocale.

2025-06-18T17:15:00+00:00 ― 6 leggere min

Calcolo e linguaggio Sfide e Progressi nella Traduzione Vocale

Uno sguardo alle complessità e ai miglioramenti nella tecnologia di traduzione da parlato a parlato.

2025-06-18T06:12:18+00:00 ― 6 leggere min

Calcolo e linguaggio Come gli stili di trascrizione influenzano la comprensione dell'inglese afroamericano

Esplorare l'impatto degli stili di trascrizione sull'accuratezza dell'inglese afroamericano.

2025-06-17T09:16:12+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il Riconoscimento Vocale per Nomi Rari

Questo metodo migliora l'accuratezza del riconoscimento per i nomi rari nei risultati vocali.

2025-06-16T03:42:40+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale in aula con un pre-addestramento continuo

Un nuovo approccio migliora i sistemi ASR per una comunicazione in aula migliore.

2025-06-12T18:44:20+00:00 ― 5 leggere min

Suono Progressi nel Ripristino del Parlato: MaskSR2

MaskSR2 migliora la chiarezza e la qualità del parlato usando tecniche innovative.

2025-06-11T07:06:40+00:00 ― 5 leggere min

Suono Sviluppi nella tecnologia di sintesi vocale

Nuovo metodo migliora la qualità e l'efficienza della generazione del parlato.

2025-06-07T10:48:10+00:00 ― 4 leggere min

Crittografia e sicurezza Nuovo metodo svela le vulnerabilità dei sensori degli smartphone

La ricerca mette in evidenza i rischi dei sensori di movimento degli smartphone, sottolineando le preoccupazioni per la privacy.

2025-06-07T00:09:24+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzando la comunicazione medica con la tecnologia ASR

Il progetto MultiMed migliora il riconoscimento vocale automatico per una comunicazione sanitaria migliore.

2025-06-05T06:10:15+00:00 ― 6 leggere min