Articoli più recenti per Riconoscimento vocale

Suono NOTSOFAR-1 Challenge: Avanzare la tecnologia di trascrizione delle riunioni

Una nuova iniziativa per migliorare la tecnologia di trascrizione per le riunioni in grandi stanze.

2025-08-29T16:23:15+00:00 ― 7 leggere min

Calcolo e linguaggio Progressi nella correzione degli errori di riconoscimento vocale

Nuovi metodi migliorano la precisione nel riconoscimento vocale rumoroso utilizzando modelli linguistici grandi.

2025-08-29T01:48:45+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Affrontare le sfide della tecnologia vocale per le lingue sotto-risorse

Questo articolo parla di soluzioni per le applicazioni vocali in lingue con dati trascritti limitati.

2025-08-28T18:31:30+00:00 ― 6 leggere min

Calcolo e linguaggio Documentare le lingue in pericolo con IGT

Un nuovo metodo aiuta a preservare le lingue a rischio attraverso una documentazione dettagliata.

2025-08-27T17:35:42+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Nuovo metodo per eliminare la voce eco

Un metodo migliora la chiarezza del parlato in ambienti rumorosi senza dati di addestramento chiari.

2025-08-26T17:56:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale per le lingue a basso recurso

Nuovi metodi migliorano l'ASR per le lingue poco rappresentate usando dati da lingue simili.

2025-08-26T10:39:15+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Reborn: Una Nuova Era nell'ASR Non Supervisionato

Reborn offre soluzioni innovative per il riconoscimento automatico della voce senza dati etichettati.

2025-08-25T19:16:10+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzamenti nella tecnologia dei dialoghi parlati

Uno sguardo ai nuovi modelli per risposte parlate naturali.

2025-08-25T03:04:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare la Diarizzazione degli Speaker con Approcci Multi-Microfono

Nuovi metodi migliorano il rilevamento dell'attività vocale e delle sovrapposizioni nella diarizzazione degli oratori.

2025-08-24T13:18:35+00:00 ― 7 leggere min

Elaborazione del segnale Chirp MFCC: Un Nuovo Approccio nell'Elaborazione Audio

Chirp MFCC migliora la rappresentazione del segnale audio per una classificazione e riconoscimento migliori.

2025-08-23T08:58:10+00:00 ― 5 leggere min

Calcolo e linguaggio Progetto Kallaama: Colleghiamo Lingua e Tecnologia nell’Agricoltura

Kallaama crea un dataset di discorsi in lingue locali per aiutare gli agricoltori senegalesi.

2025-08-23T02:43:54+00:00 ― 5 leggere min

Calcolo e linguaggio Far progredire i modelli linguistici attraverso stili di parlare

Un nuovo framework migliora i modelli linguistici riconoscendo e rispondendo a diversi stili di linguaggio.

2025-08-23T00:03:45+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Migliorare la Verifica dell'Identità per i Bambini

Migliorare i sistemi ASV per riconoscere accuratamente le voci dei bambini.

2025-08-22T09:29:15+00:00 ― 9 leggere min

Elaborazione dell'audio e del parlato Progressi nella stima delle proprietà acustiche delle stanze

La ricerca mette in evidenza nuovi modelli per una migliore qualità audio in diversi ambienti.

2025-08-22T03:00:35+00:00 ― 7 leggere min

Suono Progressi nelle tecniche di diarizzazione automatica degli speaker

La ricerca mette in evidenza l'importanza del timing rispetto a caratteristiche specifiche degli speaker nei modelli di diarizzazione.

2025-08-21T00:17:20+00:00 ― 6 leggere min

Interazione uomo-macchina Progressi nelle Interfacce di Parola Silenziosa

Uno sguardo a MONA, un sistema che migliora la comunicazione del parlato silenzioso.

2025-08-20T16:11:30+00:00 ― 5 leggere min

Robotica Migliorare il riconoscimento vocale dei robot in ambienti rumorosi

La ricerca si concentra su come aiutare i robot a capire meglio il linguaggio tra il rumore di fondo.

2025-08-19T22:22:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Valutare il riconoscimento vocale in ambienti rumorosi

Un nuovo benchmark valuta le prestazioni dei sistemi di riconoscimento vocale in mezzo a vari disturbi.

2025-08-19T14:16:50+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi negli impianti cocleari con le tecnologie AI

L'IA sta migliorando gli impianti cocleari per avere un udito e una comunicazione migliore in ambienti difficili.

2025-08-17T13:41:50+00:00 ― 7 leggere min

Suono Nuovo approccio alla separazione audio usando il linguaggio

Questo metodo migliora la separazione audio combinando descrizioni linguistiche con analisi del suono.

2025-08-13T14:57:35+00:00 ― 6 leggere min

Suono Analisi vocale innovativa per la rilevazione precoce del Parkinson

La ricerca mostra che analizzare il parlato potrebbe aiutare a identificare il Parkinson in fase precoce.

2025-08-09T16:24:42+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzare nella Comprensione del Linguaggio Parlato con CCL

Un nuovo metodo migliora come i sistemi gestiscono gli errori nella comprensione del linguaggio parlato.

2025-08-08T14:20:30+00:00 ― 7 leggere min

Calcolo e linguaggio Decodifica di Fusione Generativa: Avanzando nel Riconoscimento del Testo

Un nuovo metodo migliora l'accuratezza del riconoscimento del testo in diverse applicazioni.

2025-08-07T22:00:54+00:00 ― 7 leggere min

Calcolo e linguaggio Nuovo Metodo di Attacco Zittisce i Sistemi ASR

Un clip audio universale può silenziare modelli ASR avanzati come Whisper.

2025-08-07T03:29:35+00:00 ― 6 leggere min

Calcolo e linguaggio Progressi nel Federated Learning per il Riconoscimento Vocale

Sfruttare modelli a uscita anticipata per un federated learning efficiente nei sistemi ASR.

2025-08-06T09:48:24+00:00 ― 9 leggere min

Calcolo e linguaggio Integrazione di modelli audio e linguistici: SpeechVerse

SpeechVerse collega la comprensione audio e l'elaborazione del linguaggio per migliorare l'interazione uomo-computer.

2025-08-06T06:26:25+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale in aula con un preaddestramento continuo

Il riconoscimento vocale migliorato per le aule usando tecniche di allenamento avanzate rende l'apprendimento migliore.

2025-08-05T19:06:15+00:00 ― 7 leggere min

Apprendimento automatico Sviluppi nel Riconoscimento Automático della Voce con Modelli Linguistici di Denoising

I modelli linguistici denoising migliorano la correzione degli errori nei sistemi di riconoscimento vocale usando dati sintetici.

2025-08-03T22:34:10+00:00 ― 8 leggere min

Suono Sviluppi nelle Tecniche di Inpainting del Parlato

Scopri come il speech inpainting sta riportando a nuovo l'audio in vari settori.

2025-08-02T18:13:45+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Introducendo il Modello 4D nel Riconoscimento Vocale

Un nuovo modello migliora il riconoscimento vocale usando più metodi di decodifica.

2025-08-01T01:44:35+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale arabo tramite la distillazione della conoscenza

Uno studio su come migliorare il riconoscimento vocale automatico per i dialetti arabi usando tecniche di modelli efficienti.

2025-07-31T23:18:50+00:00 ― 5 leggere min

Calcolo e linguaggio Progressi nell'Apprendimento Auto-Supervisionato per la Voce

Esplorare il ruolo dell'apprendimento auto-supervisionato nella elaborazione del parlato e le sue sfide.

2025-07-30T15:51:24+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella tecnologia di diarizzazione del parlato target

Uno sguardo ai nuovi metodi per capire il parlato sovrapposto durante le conversazioni.

2025-07-30T14:06:55+00:00 ― 8 leggere min

Suono Migliorare gli attacchi backdoor nel riconoscimento vocale

Nuovo metodo punta sui cambiamenti di ritmo per attacchi vocali furtivi.

2025-07-29T08:09:20+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato AV-CrossNet: Migliorare il riconoscimento vocale nel rumore

Un nuovo sistema aiuta a separare il parlato dal rumore per una comunicazione più chiara.

2025-07-29T03:17:50+00:00 ― 7 leggere min

Suono Diarizzazione del Parlante in Tempo Reale: Un'Panoramica

Scopri la diarizzazione degli speaker online e il suo significato in diverse applicazioni.

2025-07-28T06:14:40+00:00 ― 7 leggere min

Suono Valutare i Token Audio Discreti per i Compiti di Parola

Nuovo strumento di benchmark valuta i token audio discreti per vari compiti di elaborazione del parlato.

2025-07-28T04:37:30+00:00 ― 9 leggere min

Calcolo e linguaggio Migliorare la correzione degli errori di parola nei sistemi ASR

Un nuovo metodo combina caratteristiche acustiche e punteggi di fiducia per una correzione degli errori migliore.

2025-07-25T20:45:15+00:00 ― 5 leggere min

Calcolo e linguaggio Come i modelli di riconoscimento vocale gestiscono i cambiamenti sonori

Uno studio su come le macchine si adattano ai cambiamenti fonologici nel linguaggio.

2025-07-25T20:31:00+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento dei parlanti con dati audio e visivi

Un sistema combina audio e video per migliorare l'accuratezza del riconoscimento degli speaker.

2025-07-25T10:13:40+00:00 ― 5 leggere min