Articoli più recenti per Riconoscimento vocale

Calcolo e linguaggio Nuovi metodi nella lavorazione del linguaggio parlato

I ricercatori esplorano approcci senza testo per capire meglio il linguaggio parlato.

2025-07-13T18:11:30+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Sviluppi nelle tecniche di miglioramento del suono

Un nuovo modello migliora la chiarezza della voce mirando a rumori ed echi.

2025-07-12T15:20:35+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nell'analisi delle immagini mediche basata su voce

Un nuovo set di dati potenzia il settore sanitario con sistemi di domande vocali per le immagini mediche.

2025-07-12T04:00:30+00:00 ― 7 leggere min

Calcolo e linguaggio Ottimizzare la correzione degli errori ASR con i modelli di linguaggio

Uno studio su come migliorare l'accuratezza delle trascrizioni grazie a un design migliore dei prompt.

2025-07-11T15:03:05+00:00 ― 6 leggere min

Suono Migliorare il riconoscimento delle emozioni nel parlato in ambienti rumorosi

Un nuovo approccio migliora i sistemi SER utilizzando descrizioni degli ambienti rumorosi.

2025-07-11T06:08:40+00:00 ― 6 leggere min

Suono Approccio Innovativo alla Formazione degli Assistenti Vocali

Combinare TTS e dati reali migliora notevolmente i sistemi di riconoscimento vocale.

2025-07-10T00:59:40+00:00 ― 4 leggere min

Suono Progressi nelle Interfacce di Parlato Silenzioso

Nuovo metodo migliora la conversione del linguaggio muto in audio comprensibile.

2025-07-09T22:33:55+00:00 ― 6 leggere min

Suono Progressi nelle tecniche di separazione del parlato audio-visivo

Un nuovo metodo migliora la separazione delle voci in ambienti rumorosi con più parlanti.

2025-07-09T16:53:50+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Un Nuovo Metodo per Misurare il Significato del Suono

Questo studio presenta un metodo per valutare il significato dei segnali sonori.

2025-07-09T16:05:15+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare le tecnologie di riconoscimento del parlato sussurrato

Nuovi metodi puntano a migliorare il riconoscimento del linguaggio sussurrato nei sistemi automatici.

2025-07-08T08:30:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con la collaborazione dell'AI

I modelli di intelligenza artificiale migliorano l'accuratezza delle conversioni da parlato a testo.

2025-07-07T09:50:10+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Bilanciare Privacy e Utilità nell'Analisi della Conversazione

Esaminando tecniche per proteggere la privacy mentre si analizzano conversazioni registrate.

2025-07-07T04:10:05+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato SynesLM: Avanzando la tecnologia audio-visiva del parlato

Un nuovo modello integra dati audio e visivi per il riconoscimento vocale e la traduzione.

2025-07-06T20:04:15+00:00 ― 6 leggere min

Suono Affrontare le sfide del riconoscimento degli accenti nella tecnologia vocale

Nuovi metodi migliorano l'accuratezza del riconoscimento vocale per diversi accenti.

2025-07-05T05:12:15+00:00 ― 5 leggere min

Calcolo e linguaggio Nuovo framework trasforma il parlato in grafi della conoscenza

Wav2graph crea grafi della conoscenza dal linguaggio parlato per migliorare la comprensione dell'AI.

2025-07-04T04:06:10+00:00 ― 7 leggere min

Suono Presentiamo MulliVC: Sistema di Conversione Vocale di Nuova Generazione

MulliVC trasforma le voci tra le lingue con una precisione e chiarezza impressionanti.

2025-07-03T11:54:30+00:00 ― 5 leggere min

Robotica I robot imparano a leggere le emozioni umane

Il nuovo sistema di navigazione dei robot capisce i comandi vocali attraverso le emozioni.

2025-07-02T20:42:06+00:00 ― 6 leggere min

Calcolo e linguaggio Il nuovo modello TOGGL migliora la trascrizione vocale

Il modello TOGGL migliora l'accuratezza della trascrizione in situazioni di discorso sovrapposto.

2025-07-02T03:31:10+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale con l'apprendimento della rappresentazione del rumore contestuale

Un metodo per migliorare la qualità del riconoscimento vocale in ambienti rumorosi.

2025-07-01T23:28:15+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella tecnologia vocale con SaSLaW

I ricercatori hanno sviluppato SaSLaW per migliorare l'adattamento della voce delle macchine in vari ambienti.

2025-07-01T16:11:00+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare il bias nei modelli di linguaggio

Un nuovo dataset mette in evidenza i pregiudizi nei modelli di linguaggio basati su genere ed età.

2025-06-30T19:07:50+00:00 ― 7 leggere min

Calcolo e linguaggio Progressi nei modelli vocali grazie a tecniche di potatura

La ricerca mostra come rendere i modelli di linguaggio più piccoli ed efficienti.

2025-06-29T16:24:35+00:00 ― 5 leggere min

Suono Migliorare il riconoscimento delle parole chiave con l'addestramento avversario

L'addestramento avversariale migliora l'accuratezza del riconoscimento delle parole chiave nel parlato sintetico e reale.

2025-06-28T13:41:20+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare i modelli di riconoscimento delle emozioni nel parlato con un nuovo benchmark

Un nuovo benchmark migliora la valutazione dei sistemi di riconoscimento delle emozioni nel parlato attraverso lingue ed emozioni.

2025-06-28T04:15:30+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale multilingue senza dati originali

Nuovi metodi migliorano i modelli ASR per più lingue, preservando le conoscenze passate.

2025-06-27T15:01:00+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale bilingue con XCB

Un nuovo approccio migliora il riconoscimento delle frasi con cambio di codice nel linguaggio bilingue.

2025-06-27T11:46:40+00:00 ― 6 leggere min

Apprendimento automatico Progressi nel Processamento delle Sequenze con MRConv

Un nuovo metodo per gestire meglio lunghe sequenze di dati.

2025-06-26T07:21:36+00:00 ― 5 leggere min

Calcolo e linguaggio Il Ruolo della Prosodia e della Pragmatica nella Tecnologia del Parlato

Esaminando come i modelli vocali influenzano il significato e le prestazioni della tecnologia.

2025-06-25T21:43:15+00:00 ― 5 leggere min

Suono Sfide nel Rilevare Segnali Vocali Parzialmente Falsi

Uno sguardo alle complessità dell'identificazione delle tracce audio miste.

2025-06-25T06:20:10+00:00 ― 6 leggere min

Calcolo e linguaggio O-HuBERT: Un Passo Avanti nel Riconoscimento Vocale

O-HuBERT migliora il riconoscimento vocale separando il contenuto dalle informazioni espressive.

2025-06-24T20:04:24+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale in hindi con pseudo-etichettatura

Un nuovo metodo migliora il riconoscimento vocale per l'hindi usando tecniche di pseudo-etichettatura.

2025-06-24T06:02:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Preservare i dialetti tamil attraverso la tecnologia

Un sistema per classificare i dialetti tamil letterari e colloquiali usando le caratteristiche sonore.

2025-06-23T13:51:00+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale: Sussurrato vs. Normale

Nuovi metodi migliorano la comprensione del computer del parlato sussurrato e normale.

2025-06-23T08:59:30+00:00 ― 5 leggere min

Apprendimento automatico Capire il Micro-batch Clipping nel Machine Learning

Uno sguardo al micro-batch clipping e ai suoi vantaggi per l'allenamento dei modelli.

2025-06-23T05:45:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale giapponese con tecniche GER

La ricerca dimostra come i LLM migliorano il riconoscimento vocale automatico nella lingua giapponese.

2025-06-23T04:08:00+00:00 ― 6 leggere min

Calcolo e linguaggio Come i modelli di linguaggio apprendono i suprasegmentali

Questo articolo esamina come i modelli riconoscono il tono, l'accento e gli accenti di intonazione.

2025-06-22T21:19:54+00:00 ― 5 leggere min

Calcolo e linguaggio Presentiamo SALSA: Un Nuovo Metodo per Migliorare l'ASR

SALSA migliora la precisione del riconoscimento vocale per le lingue a basse risorse integrando i modelli ASR e i modelli linguistici.

2025-06-22T06:16:15+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il Riconoscimento Vocale Automatico con Modelli Linguistici

Nuovo metodo migliora l'accuratezza dell'ASR usando modelli linguistici per trascrizioni migliori.

2025-06-21T20:33:15+00:00 ― 4 leggere min

Calcolo e linguaggio Migliorare l'accuratezza del tagging degli speaker nelle conversazioni

Un nuovo sistema corregge gli errori di identificazione dell'oratore per trascrizioni di conversazione più chiare.

2025-06-21T18:56:05+00:00 ― 8 leggere min

Suono Sviluppi nelle Tecniche di Miglioramento del Suono

Migliorare la chiarezza del parlato tramite filtri ibridi e reti neurali.

2025-06-21T17:18:55+00:00 ― 5 leggere min