Articoli più recenti per Riconoscimento vocale

Elaborazione dell'audio e del parlato Avanzamenti nella tecnologia vocale con SaSLaW

I ricercatori hanno sviluppato SaSLaW per migliorare l'adattamento della voce delle macchine in vari ambienti.

2025-07-01T16:11:00+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare il bias nei modelli di linguaggio

Un nuovo dataset mette in evidenza i pregiudizi nei modelli di linguaggio basati su genere ed età.

2025-06-30T19:07:50+00:00 ― 7 leggere min

Calcolo e linguaggio Progressi nei modelli vocali grazie a tecniche di potatura

La ricerca mostra come rendere i modelli di linguaggio più piccoli ed efficienti.

2025-06-29T16:24:35+00:00 ― 5 leggere min

Suono Migliorare il riconoscimento delle parole chiave con l'addestramento avversario

L'addestramento avversariale migliora l'accuratezza del riconoscimento delle parole chiave nel parlato sintetico e reale.

2025-06-28T13:41:20+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare i modelli di riconoscimento delle emozioni nel parlato con un nuovo benchmark

Un nuovo benchmark migliora la valutazione dei sistemi di riconoscimento delle emozioni nel parlato attraverso lingue ed emozioni.

2025-06-28T04:15:30+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale multilingue senza dati originali

Nuovi metodi migliorano i modelli ASR per più lingue, preservando le conoscenze passate.

2025-06-27T15:01:00+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale bilingue con XCB

Un nuovo approccio migliora il riconoscimento delle frasi con cambio di codice nel linguaggio bilingue.

2025-06-27T11:46:40+00:00 ― 6 leggere min

Apprendimento automatico Progressi nel Processamento delle Sequenze con MRConv

Un nuovo metodo per gestire meglio lunghe sequenze di dati.

2025-06-26T07:21:36+00:00 ― 5 leggere min

Calcolo e linguaggio Il Ruolo della Prosodia e della Pragmatica nella Tecnologia del Parlato

Esaminando come i modelli vocali influenzano il significato e le prestazioni della tecnologia.

2025-06-25T21:43:15+00:00 ― 5 leggere min

Suono Sfide nel Rilevare Segnali Vocali Parzialmente Falsi

Uno sguardo alle complessità dell'identificazione delle tracce audio miste.

2025-06-25T06:20:10+00:00 ― 6 leggere min

Calcolo e linguaggio O-HuBERT: Un Passo Avanti nel Riconoscimento Vocale

O-HuBERT migliora il riconoscimento vocale separando il contenuto dalle informazioni espressive.

2025-06-24T20:04:24+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale in hindi con pseudo-etichettatura

Un nuovo metodo migliora il riconoscimento vocale per l'hindi usando tecniche di pseudo-etichettatura.

2025-06-24T06:02:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Preservare i dialetti tamil attraverso la tecnologia

Un sistema per classificare i dialetti tamil letterari e colloquiali usando le caratteristiche sonore.

2025-06-23T13:51:00+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale: Sussurrato vs. Normale

Nuovi metodi migliorano la comprensione del computer del parlato sussurrato e normale.

2025-06-23T08:59:30+00:00 ― 5 leggere min

Apprendimento automatico Capire il Micro-batch Clipping nel Machine Learning

Uno sguardo al micro-batch clipping e ai suoi vantaggi per l'allenamento dei modelli.

2025-06-23T05:45:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale giapponese con tecniche GER

La ricerca dimostra come i LLM migliorano il riconoscimento vocale automatico nella lingua giapponese.

2025-06-23T04:08:00+00:00 ― 6 leggere min

Calcolo e linguaggio Come i modelli di linguaggio apprendono i suprasegmentali

Questo articolo esamina come i modelli riconoscono il tono, l'accento e gli accenti di intonazione.

2025-06-22T21:19:54+00:00 ― 5 leggere min

Calcolo e linguaggio Presentiamo SALSA: Un Nuovo Metodo per Migliorare l'ASR

SALSA migliora la precisione del riconoscimento vocale per le lingue a basse risorse integrando i modelli ASR e i modelli linguistici.

2025-06-22T06:16:15+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il Riconoscimento Vocale Automatico con Modelli Linguistici

Nuovo metodo migliora l'accuratezza dell'ASR usando modelli linguistici per trascrizioni migliori.

2025-06-21T20:33:15+00:00 ― 4 leggere min

Calcolo e linguaggio Migliorare l'accuratezza del tagging degli speaker nelle conversazioni

Un nuovo sistema corregge gli errori di identificazione dell'oratore per trascrizioni di conversazione più chiare.

2025-06-21T18:56:05+00:00 ― 8 leggere min

Suono Sviluppi nelle Tecniche di Miglioramento del Suono

Migliorare la chiarezza del parlato tramite filtri ibridi e reti neurali.

2025-06-21T17:18:55+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia di riconoscimento vocale audio-visivo

Un nuovo modello migliora il riconoscimento vocale combinando in modo efficace input audio e visivi.

2025-06-21T05:58:45+00:00 ― 5 leggere min

Suono Progressi nel riconoscimento vocale multi-parlante

Nuovi metodi migliorano il riconoscimento vocale in situazioni difficili con più parlanti.

2025-06-20T21:52:55+00:00 ― 5 leggere min

Suono Migliorare le prestazioni dell'ASR mantenendo l'ordine temporale

Un nuovo metodo migliora il riconoscimento vocale automatico mantenendo l'ordine dei suoni nel trasferimento delle conoscenze.

2025-06-19T19:58:15+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con l'addestramento aumentato da rumore

Questo studio analizza come il rumore possa migliorare la resilienza nel riconoscimento del parlato di fronte alle sfide.

2025-06-19T14:18:10+00:00 ― 6 leggere min

Calcolo e linguaggio Progressi nei modelli di riconoscimento vocale leggeri

Un trasduttore innovativo e leggero migliora l'efficienza e la precisione del riconoscimento vocale.

2025-06-19T07:00:55+00:00 ― 6 leggere min

Calcolo e linguaggio Confronto dei metodi di rappresentazione del parlato nei sistemi di riconoscimento

Questo articolo confronta le rappresentazioni di voce discrete e continue per un riconoscimento vocale efficace.

2025-06-19T00:14:36+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Approfondimenti sui neuroni nei modelli di linguaggio

La ricerca svela come i neuroni nei modelli di linguaggio riconoscono le caratteristiche chiave del suono.

2025-06-17T11:17:25+00:00 ― 7 leggere min

Calcolo e linguaggio Indagare l'autoattenzione nei modelli di parlato

Questo studio esamina come l'autoattenzione influisce sul riconoscimento vocale in turco e inglese.

2025-06-17T10:35:12+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Nuovo sistema per stimare le caratteristiche sonore delle stanze

Un approccio di apprendimento auto-supervisionato riduce la necessità di dati audio etichettati.

2025-06-17T04:00:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella localizzazione delle sorgenti sonore con TF-Mamba

TF-Mamba migliora la localizzazione del suono usando un nuovo metodo che integra dati temporali e di frequenza.

2025-06-16T19:54:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il Riconoscimento Automático della Voce con la Modularità

La ricerca sui sistemi ASR modulari punta a migliorare le performance in ambienti rumorosi.

2025-06-16T17:28:35+00:00 ― 4 leggere min

Suono Estrazione del parlato target causale con embedding dinamici: un nuovo approccio

Presentiamo DENSE, un metodo che migliora l'estrazione del discorso target usando embedding dinamici.

2025-06-16T08:34:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il Riconoscimento Vocale per Nomi Rari

Questo metodo migliora l'accuratezza del riconoscimento per i nomi rari nei risultati vocali.

2025-06-16T03:42:40+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzare nella localizzazione delle parole chiave in lingue a bassa risorsa

Migliorare l'identificazione delle parole parlate tramite indizi visivi in lingue poco supportate.

2025-06-16T02:05:30+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato BigCodec: Avanzando nel Codifica Vocale a Basso Bitrate

BigCodec migliora la qualità del suono nella trasmissione audio a bassa bitrate.

2025-06-15T19:36:50+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Semplificare i modelli di linguaggio: ridurre la complessità nei transformer

Questo articolo parla dei vantaggi di semplificare i modelli transformer per i compiti di riconoscimento vocale.

2025-06-15T14:45:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel Riconoscimento Vocale con Sortformer

Sortformer integra la diarizzazione degli speaker e l'ASR per migliorare l'elaborazione audio.

2025-06-15T09:05:15+00:00 ― 5 leggere min

Calcolo e linguaggio Progressi nella classificazione del linguaggio parlato

Nuovi metodi migliorano la comprensione del linguaggio parlato grazie a un dataset innovativo.

2025-06-15T04:13:45+00:00 ― 5 leggere min

Robotica Progressi nella tecnologia di riconoscimento vocale per robot

Nuovi metodi migliorano la conversazione uomo-robot rendendo il parlato più chiaro.

2025-06-15T01:48:00+00:00 ― 5 leggere min