I ricercatori esplorano approcci senza testo per capire meglio il linguaggio parlato.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
I ricercatori esplorano approcci senza testo per capire meglio il linguaggio parlato.
― 7 leggere min
Un nuovo modello migliora la chiarezza della voce mirando a rumori ed echi.
― 6 leggere min
Un nuovo set di dati potenzia il settore sanitario con sistemi di domande vocali per le immagini mediche.
― 7 leggere min
Uno studio su come migliorare l'accuratezza delle trascrizioni grazie a un design migliore dei prompt.
― 6 leggere min
Un nuovo approccio migliora i sistemi SER utilizzando descrizioni degli ambienti rumorosi.
― 6 leggere min
Combinare TTS e dati reali migliora notevolmente i sistemi di riconoscimento vocale.
― 4 leggere min
Nuovo metodo migliora la conversione del linguaggio muto in audio comprensibile.
― 6 leggere min
Un nuovo metodo migliora la separazione delle voci in ambienti rumorosi con più parlanti.
― 5 leggere min
Questo studio presenta un metodo per valutare il significato dei segnali sonori.
― 6 leggere min
Nuovi metodi puntano a migliorare il riconoscimento del linguaggio sussurrato nei sistemi automatici.
― 6 leggere min
I modelli di intelligenza artificiale migliorano l'accuratezza delle conversioni da parlato a testo.
― 5 leggere min
Esaminando tecniche per proteggere la privacy mentre si analizzano conversazioni registrate.
― 5 leggere min
Un nuovo modello integra dati audio e visivi per il riconoscimento vocale e la traduzione.
― 6 leggere min
Nuovi metodi migliorano l'accuratezza del riconoscimento vocale per diversi accenti.
― 5 leggere min
Wav2graph crea grafi della conoscenza dal linguaggio parlato per migliorare la comprensione dell'AI.
― 7 leggere min
MulliVC trasforma le voci tra le lingue con una precisione e chiarezza impressionanti.
― 5 leggere min
Il nuovo sistema di navigazione dei robot capisce i comandi vocali attraverso le emozioni.
― 6 leggere min
Il modello TOGGL migliora l'accuratezza della trascrizione in situazioni di discorso sovrapposto.
― 5 leggere min
Un metodo per migliorare la qualità del riconoscimento vocale in ambienti rumorosi.
― 7 leggere min
I ricercatori hanno sviluppato SaSLaW per migliorare l'adattamento della voce delle macchine in vari ambienti.
― 5 leggere min
Un nuovo dataset mette in evidenza i pregiudizi nei modelli di linguaggio basati su genere ed età.
― 7 leggere min
La ricerca mostra come rendere i modelli di linguaggio più piccoli ed efficienti.
― 5 leggere min
L'addestramento avversariale migliora l'accuratezza del riconoscimento delle parole chiave nel parlato sintetico e reale.
― 5 leggere min
Un nuovo benchmark migliora la valutazione dei sistemi di riconoscimento delle emozioni nel parlato attraverso lingue ed emozioni.
― 6 leggere min
Nuovi metodi migliorano i modelli ASR per più lingue, preservando le conoscenze passate.
― 5 leggere min
Un nuovo approccio migliora il riconoscimento delle frasi con cambio di codice nel linguaggio bilingue.
― 6 leggere min
Un nuovo metodo per gestire meglio lunghe sequenze di dati.
― 5 leggere min
Esaminando come i modelli vocali influenzano il significato e le prestazioni della tecnologia.
― 5 leggere min
Uno sguardo alle complessità dell'identificazione delle tracce audio miste.
― 6 leggere min
O-HuBERT migliora il riconoscimento vocale separando il contenuto dalle informazioni espressive.
― 6 leggere min
Un nuovo metodo migliora il riconoscimento vocale per l'hindi usando tecniche di pseudo-etichettatura.
― 5 leggere min
Un sistema per classificare i dialetti tamil letterari e colloquiali usando le caratteristiche sonore.
― 6 leggere min
Nuovi metodi migliorano la comprensione del computer del parlato sussurrato e normale.
― 5 leggere min
Uno sguardo al micro-batch clipping e ai suoi vantaggi per l'allenamento dei modelli.
― 6 leggere min
La ricerca dimostra come i LLM migliorano il riconoscimento vocale automatico nella lingua giapponese.
― 6 leggere min
Questo articolo esamina come i modelli riconoscono il tono, l'accento e gli accenti di intonazione.
― 5 leggere min
SALSA migliora la precisione del riconoscimento vocale per le lingue a basse risorse integrando i modelli ASR e i modelli linguistici.
― 6 leggere min
Nuovo metodo migliora l'accuratezza dell'ASR usando modelli linguistici per trascrizioni migliori.
― 4 leggere min
Un nuovo sistema corregge gli errori di identificazione dell'oratore per trascrizioni di conversazione più chiare.
― 8 leggere min
Migliorare la chiarezza del parlato tramite filtri ibridi e reti neurali.
― 5 leggere min