Articoli più recenti per Riconoscimento vocale

Elaborazione dell'audio e del parlato Difendere il Riconoscimento Automatico del Parlato dagli Attacchi Adversariali Audiovisivi

Un nuovo metodo migliora le difese contro attacchi audio avversari nei sistemi di riconoscimento vocale.

2025-11-18T22:11:55+00:00 ― 6 leggere min

Apprendimento automatico Avanzamenti nell'analisi dei dati funzionali

Un nuovo metodo migliora l'analisi dei dati funzionali complessi.

2025-11-18T10:07:44+00:00 ― 7 leggere min

Suono Avanzare il Riconoscimento Automatico della Voce con Tecniche Multi-Modali

Un nuovo modello unisce dati audio e testuali per migliorare l'accuratezza del riconoscimento vocale.

2025-11-18T00:43:36+00:00 ― 5 leggere min

Apprendimento automatico Nuovo metodo per rilevare l'enfasi nel parlato

Un approccio innovativo usa la tecnologia deepfake per identificare l'enfasi nel linguaggio parlato.

2025-11-17T15:22:42+00:00 ― 6 leggere min

Calcolo e linguaggio Progresso nell'apprendimento vocale autosupervisionato

Un nuovo metodo migliora la comprensione del parlato da parte delle macchine usando dati audio non etichettati.

2025-11-15T20:19:24+00:00 ― 5 leggere min

Calcolo e linguaggio Introducing SpeechGPT: Un Nuovo Modello Multi-Modale

SpeechGPT collega discorso e testo per interazioni AI avanzate.

2025-11-14T22:12:12+00:00 ― 4 leggere min

Suono Migliorare il riconoscimento delle parole chiave con CosMix

Un nuovo metodo migliora i sistemi di rilevamento delle parole chiave in condizioni a basso consumo di risorse.

2025-11-14T21:50:30+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzando la comprensione del parlato con SPECTRA

Un nuovo modello migliora la comprensione dei dialoghi parlati unendo voce e testo.

2025-11-14T07:35:18+00:00 ― 6 leggere min

Calcolo e linguaggio Sviluppi nei modelli di linguaggio basati sull'energia per il riconoscimento vocale

I modelli di linguaggio basati sull'energia mostrano potenzialità nel migliorare l'accuratezza del riconoscimento vocale.

2025-11-13T20:23:48+00:00 ― 5 leggere min

Apprendimento automatico Migliorare le previsioni con adattamento a miglior sforzo

Quest'articolo parla di come migliorare le previsioni adattando dati provenienti da diversi ambiti.

2025-11-13T18:18:48+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzamenti nei sistemi di comprensione del linguaggio parlato

Un nuovo approccio migliora la comprensione del linguaggio parlato usando un'elaborazione audio efficiente.

2025-11-13T02:07:00+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare i modelli di linguaggio grandi nei compiti in arabo

Questo studio analizza le performance dei LLM negli compiti di NLP e vocale in arabo.

2025-11-11T09:40:24+00:00 ― 5 leggere min

Suono Avanzamenti nella separazione audio con AudioSlots

AudioSlots migliora la chiarezza del suono separando efficacemente le registrazioni audio miste.

2025-11-11T03:57:45+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella tecnologia di riconoscimento vocale automatico

Nuovo metodo migliora i modelli di riconoscimento vocale riducendo la perdita di conoscenza.

2025-11-09T22:48:45+00:00 ― 4 leggere min

Probabilità Filtraggio Bayesiano: Aggiornare le credenze con nuove prove

Scopri come il filtraggio bayesiano aiuta a migliorare la comprensione nei sistemi incerti.

2025-11-09T15:25:38+00:00 ― 7 leggere min

Calcolo e linguaggio Sviluppi nella tecnologia di riconoscimento vocale

Esplorando metodi per migliorare l'adattamento dei modelli linguistici nei sistemi di riconoscimento vocale.

2025-11-09T08:25:48+00:00 ― 5 leggere min

Comportamento e cognizione animale Adattare Whisper per la Rilevazione dell'Attività Vocale in Umani e Animali

Questo studio adatta il modello Whisper per rilevare vocalizzazioni tra le specie.

2025-11-08T17:32:51+00:00 ― 5 leggere min

Suono Progressi nelle Tecniche di Separazione del Parlato

Un nuovo approccio non supervisionato migliora l'isolamento della voce nei mix audio.

2025-11-07T23:50:55+00:00 ― 4 leggere min

Suono ML-SUPERB: Valutazione dei modelli di parlato multilingue

Un nuovo benchmark per valutare i modelli di machine learning nella comprensione del parlato tra le lingue.

2025-11-07T23:02:20+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare la classificazione delle fonemi nel riconoscimento vocale

Questo articolo parla di metodi per migliorare la classificazione dei telefoni usando le caratteristiche audio.

2025-11-07T21:25:10+00:00 ― 7 leggere min

Suono Bilanciare privacy ed efficienza nei modelli di linguaggio

Un nuovo metodo garantisce la privacy nella classificazione del linguaggio senza compromettere le prestazioni.

2025-11-07T10:05:00+00:00 ― 6 leggere min

Calcolo e linguaggio Come i modelli di linguaggio parlato capiscono la sintassi

La ricerca esamina la comprensione della sintassi nei modelli di linguaggio parlato utilizzando vari metodi.

2025-11-07T07:34:54+00:00 ― 6 leggere min

Calcolo e linguaggio Identificare i dialetti arabi con tecniche moderne

Questo studio si concentra sul riconoscimento dei dialetti arabi usando metodi avanzati e dati limitati.

2025-11-07T06:02:05+00:00 ― 4 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale per le lingue minoritarie

Questo studio esamina modi per migliorare l'ASR per lingue a bassa risorsa usando tecniche di dati.

2025-11-07T01:59:10+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nel riconoscimento delle parole chiave con TACos

Un nuovo metodo migliora il rilevamento delle parole chiave nelle registrazioni audio.

2025-11-06T23:33:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nelle tecniche di compressione dei modelli vocali

Un nuovo metodo migliora i modelli di linguaggio riducendo al contempo le risorse necessarie.

2025-11-06T11:24:40+00:00 ― 6 leggere min

Suono Sviluppi nel monitoraggio della salute basato sulla parola

Nuovi metodi che usano la voce sembrano promettenti per identificare i modelli respiratori e le condizioni di salute.

2025-11-06T10:36:05+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il Riconoscimento Vocale: Nuove Tecniche per Velocità e Precisione

Nuovi metodi aumentano l'efficienza nei sistemi di riconoscimento vocale senza perdere precisione.

2025-11-06T08:10:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel riconoscimento delle parole chiave in ambienti rumorosi

Nuovo modello migliora il riconoscimento delle parole chiave in situazioni acustiche difficili.

2025-11-06T04:07:25+00:00 ― 6 leggere min

Apprendimento automatico Warping Ottimale per il Trasporto: Un Nuovo Metodo per l'Analisi delle Serie Temporali

OTW offre un'alternativa più veloce a DTW per confrontare i dati delle serie temporali.

2025-11-06T00:06:48+00:00 ― 6 leggere min

Suono Avanzamenti nei Sistemi di Riconoscimento Vocale per la Sfida VoxCeleb

Uno sguardo dettagliato alle tecniche di riconoscimento vocale sviluppate per la competizione del 2022.

2025-11-05T21:38:45+00:00 ― 5 leggere min

Calcolo e linguaggio Sviluppi nei modelli di riconoscimento del linguaggio parlato

Migliorare il riconoscimento linguistico con modelli più piccoli e veloci per applicazioni nella vita reale.

2025-11-05T17:00:12+00:00 ― 6 leggere min

Calcolo e linguaggio Sfruttare ciwGAN per l'analisi fonologica

Esplorare come ciwGAN possa imparare e rappresentare caratteristiche fonologiche come la nasalità.

2025-11-05T15:10:05+00:00 ― 5 leggere min

Suono Simulando Discorso Rumoroso per una Migliore Riconoscenza

I ricercatori usano i GAN per generare discorsi rumorosi da audio pulito, migliorando i modelli di parlato.

2025-11-05T12:44:20+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzando i modelli di linguaggio attraverso la conoscenza testuale

Usare modelli di testo per migliorare la generazione del parlato per una comprensione migliore.

2025-11-05T09:30:00+00:00 ― 8 leggere min

Calcolo e linguaggio Migliorare l'accuratezza dell'ASR con tecniche di dati sintetici

Le ricerche dimostrano come il testo sintetico possa migliorare efficacemente i sistemi ASR.

2025-11-05T04:38:30+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Adattamento Dominio Modulare: Un Nuovo Approccio al Riconoscimento Vocale

MDA migliora il riconoscimento vocale ottimizzando i modelli per aree di dati specifiche.

2025-11-05T01:24:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale per tutti i parlanti

Un nuovo metodo punta a migliorare i sistemi ASR per i parlanti con disartria.

2025-11-04T22:58:25+00:00 ― 5 leggere min

Calcolo e linguaggio Progressi nell'apprendimento delle parole parlate con MAMLCon

Un nuovo metodo migliora la comprensione dei comandi vocali da parte dei computer con meno esempi.

2025-11-04T22:09:50+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare la Diarizzazione del Parlante Usando l'Analisi delle Parole

Migliorare l'identificazione degli speaker combinando suoni e parole parlate nell'audio.

2025-11-04T18:55:30+00:00 ― 5 leggere min