Articoli più recenti per Riconoscimento Vocale Automatico

Calcolo e linguaggio Migliorare il riconoscimento delle entità da trascrizioni mediche rumorose

Questo studio affronta le sfide nel catturare termini medici precisi da audio rumoroso.

2025-08-26T04:59:30+00:00 ― 8 leggere min

Calcolo e linguaggio Migliorare il Riconoscimento Vocale con Dati Acustici

Un nuovo metodo integra informazioni acustiche nei modelli linguistici per una migliore riconoscimento vocale.

2025-08-25T02:15:55+00:00 ― 9 leggere min

Calcolo e linguaggio Migliorare la trascrizione medica con l'IA

I LLM migliorano la precisione nelle trascrizioni mediche, avvantaggiando la cura dei pazienti.

2025-08-24T16:32:55+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Codec-SUPERB: Un Benchmark per Codec Audio

Un nuovo sistema per valutare le prestazioni dei codec audio in diverse applicazioni.

2025-08-22T23:15:10+00:00 ― 7 leggere min

Suono Capire la tecnologia di riconoscimento vocale automatico

Una panoramica dell'ASR e dei suoi progressi nelle applicazioni moderne.

2025-08-20T15:22:55+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Progressi negli impianti cocleari con le tecnologie AI

L'IA sta migliorando gli impianti cocleari per avere un udito e una comunicazione migliore in ambienti difficili.

2025-08-17T13:41:50+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Progressi nella valutazione automatica della qualità del parlato

Un nuovo metodo migliora la valutazione del parlato usando registrazioni intere.

2025-08-14T06:20:40+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Valutare i modelli di elaborazione del parlato con SUPERB

Un nuovo framework per valutare i modelli di base nei compiti di parlato.

2025-08-11T09:31:05+00:00 ― 8 leggere min

Calcolo e linguaggio Sviluppi nei Sistemi di Sottotitolazione Automatica

Un nuovo metodo crea direttamente i sottotitoli, migliorando l'accessibilità per diversi tipi di pubblico.

2025-08-10T07:49:00+00:00 ― 8 leggere min

Calcolo e linguaggio Valutare i sistemi ASR per la parlata balbettante

Questo studio valuta le performance dei sistemi ASR con persone che balbettano.

2025-08-07T04:18:10+00:00 ― 8 leggere min

Calcolo e linguaggio Nuovo Metodo di Attacco Zittisce i Sistemi ASR

Un clip audio universale può silenziare modelli ASR avanzati come Whisper.

2025-08-07T03:29:35+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale in aula con un preaddestramento continuo

Il riconoscimento vocale migliorato per le aule usando tecniche di allenamento avanzate rende l'apprendimento migliore.

2025-08-05T19:06:15+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Progressi nel miglioramento del parlato con VPIDM

Il nuovo modello VPIDM migliora la chiarezza della voce in ambienti rumorosi.

2025-08-03T16:54:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Introducendo il Modello 4D nel Riconoscimento Vocale

Un nuovo modello migliora il riconoscimento vocale usando più metodi di decodifica.

2025-08-01T01:44:35+00:00 ― 7 leggere min

Calcolo e linguaggio Presentiamo mHuBERT-147: Un Modello di Voce Compatto

mHuBERT-147 elabora il parlato in più lingue in modo efficiente.

2025-07-30T22:12:45+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzamenti nel Riconoscimento Vocale Scientifico Multimodale

Migliorare l'accuratezza nella trascrizione di presentazioni scientifiche attraverso l'integrazione del parlato e delle immagini.

2025-07-28T04:36:24+00:00 ― 9 leggere min

Calcolo e linguaggio La sfida linguistica di Nollywood: unire i dialetti

Uno studio sulla traduzione dell'inglese nigeriano per una migliore accessibilità nei film di Nollywood.

2025-07-24T04:16:05+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzamenti nella traduzione da parlato a testo con LLMs

Nuovo modello migliora la traduzione da parlato a testo usando grandi modelli linguistici.

2025-07-23T08:01:30+00:00 ― 7 leggere min

Calcolo e linguaggio Avanzamenti nell'anonimizzazione dei parlanti multilingue

Migliorare la tecnologia di anonimizzazione dei parlanti per nove lingue per garantire la privacy.

2025-07-23T03:58:35+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzando il Riconoscimento Vocale con Codici Specifici per Accenti

Nuovo metodo migliora la gestione degli accenti nei sistemi ASR tramite codici specializzati.

2025-07-22T04:29:40+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzare la tecnologia del parlato per l'arabo tunisino

Questo studio valuta la tecnologia vocale in lingue a basso costo come l'arabo tunisino.

2025-07-21T12:18:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Valutare l'efficienza di Mamba nella tecnologia del parlato

Mamba promette bene contro i transformers nei compiti di linguaggio, specialmente per input lunghi.

2025-07-17T13:33:45+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con indizi contestuali

Scopri come il contesto migliora la precisione del riconoscimento vocale automatico e del riconoscimento delle parole.

2025-07-16T14:53:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale per la lingua polacca

La ricerca presenta nuovi metodi per valutare i sistemi di riconoscimento vocale in polacco.

2025-07-14T16:44:10+00:00 ― 6 leggere min

Calcolo e linguaggio Ottimizzare la correzione degli errori ASR con i modelli di linguaggio

Uno studio su come migliorare l'accuratezza delle trascrizioni grazie a un design migliore dei prompt.

2025-07-11T15:03:05+00:00 ― 6 leggere min

Calcolo e linguaggio Sviluppi nella tecnologia di traduzione automatica del parlato

Un nuovo modello punta a migliorare la qualità della traduzione vocale attraverso sistemi integrati.

2025-07-11T02:54:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare le tecnologie di riconoscimento del parlato sussurrato

Nuovi metodi puntano a migliorare il riconoscimento del linguaggio sussurrato nei sistemi automatici.

2025-07-08T08:30:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con la collaborazione dell'AI

I modelli di intelligenza artificiale migliorano l'accuratezza delle conversioni da parlato a testo.

2025-07-07T09:50:10+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale per termini specialistici

La ricerca migliora i sistemi ASR usando modelli linguistici per una maggiore precisione.

2025-07-06T20:41:12+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con parole chiave contestuali

Un nuovo sistema migliora il riconoscimento vocale usando parole chiave contestuali per una maggiore precisione.

2025-06-29T22:53:15+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale multilingue senza dati originali

Nuovi metodi migliorano i modelli ASR per più lingue, preservando le conoscenze passate.

2025-06-27T15:01:00+00:00 ― 5 leggere min

Calcolo e linguaggio Il ruolo dell'ASR nella trascrizione in tribunale

Esaminare il riconoscimento vocale automatico nei sistemi giudiziari canadesi e il suo impatto.

2025-06-24T14:48:24+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale giapponese con tecniche GER

La ricerca dimostra come i LLM migliorano il riconoscimento vocale automatico nella lingua giapponese.

2025-06-23T04:08:00+00:00 ― 6 leggere min

Calcolo e linguaggio Presentiamo SALSA: Un Nuovo Metodo per Migliorare l'ASR

SALSA migliora la precisione del riconoscimento vocale per le lingue a basse risorse integrando i modelli ASR e i modelli linguistici.

2025-06-22T06:16:15+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare l'accuratezza dell'ASR per l'accessibilità

Esaminare le performance del riconoscimento automatico della voce per utenti sordi e ipoudenti.

2025-06-22T01:24:45+00:00 ― 12 leggere min

Calcolo e linguaggio Usare i dati vocali per la diagnosi dell'autismo

Un nuovo metodo sfrutta i dati vocali per migliorare le valutazioni sull'autismo.

2025-06-19T19:12:12+00:00 ― 6 leggere min

Apprendimento automatico Sviluppi nei Modelli Generativi e le Loro Applicazioni

Esaminando gli ultimi sviluppi nei modelli generativi in vari settori.

2025-06-14T04:06:48+00:00 ― 6 leggere min

Calcolo e linguaggio WhisperNER: Fondere Riconoscimento Vocale e Rilevamento di Entità

Un nuovo modello combina il riconoscimento vocale e il riconoscimento delle entità per risultati migliori.

2025-06-13T03:29:30+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale in aula con un pre-addestramento continuo

Un nuovo approccio migliora i sistemi ASR per una comunicazione in aula migliore.

2025-06-12T18:44:20+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare il Riconoscimento Vocale con Vari Tipi di Input

Questo articolo esplora come input diversi possono aumentare l'accuratezza del riconoscimento vocale.

2025-06-12T15:30:00+00:00 ― 5 leggere min