Ingegneria elettrica e scienze dei sistemi - Elaborazione dell'audio e del parlato

RSS

Calcolo e linguaggio Migliorare l'apprendimento delle lingue con L1-MultiMDD

Un nuovo sistema migliora le abilità di pronuncia tenendo conto delle influenze della lingua madre.

2025-09-12T01:50:50+00:00 ― 6 leggere min

Tecnologie emergenti Il calcolo quantistico incontra la composizione musicale

Scopri come gli strumenti quantistici cambiano la creazione e la performance musicale.

2025-09-12T00:31:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia di conversione vocale

Un nuovo metodo migliora la preservazione delle emozioni nei processi di conversione vocale.

2025-09-12T00:13:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Emo-StarGAN: Avanzando la tecnologia di conversione vocale

Nuovo metodo conserva il tono emotivo nella conversione della voce per una migliore interazione uomo-computer.

2025-09-11T23:25:05+00:00 ― 6 leggere min

Calcolo e linguaggio Sviluppi nella traduzione diretta da testo a voce

Nuovi sistemi migliorano la traduzione da testo a linguaggio parlato senza intermediari.

2025-09-11T20:59:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la classificazione dei suoni cardiaci con l'augmentazione dei dati

I ricercatori migliorano l'accuratezza nella classificazione dei suoni cardiaci usando metodi di aumento dei dati con codec.

2025-09-11T19:22:10+00:00 ― 6 leggere min

Suono Le sfide emotive mettono alla prova i modelli di separazione del parlato

Le ricerche mostrano che il discorso emotivo influisce sulle performance dei modelli nei compiti di separazione del parlato.

2025-09-11T18:33:35+00:00 ― 7 leggere min

Suono M-AUDIODEC: Un nuovo modo per comprimere l'audio

M-AUDIODEC comprime l'audio multicanale mantenendo la posizione degli altoparlanti e la qualità.

2025-09-11T16:56:25+00:00 ― 6 leggere min

Suono Progressi nella tecnologia di traduzione da parola a parola

Nuovi metodi in S2ST migliorano la qualità della traduzione mantenendo l'identità del parlante.

2025-09-11T16:07:50+00:00 ― 6 leggere min

Suono Avanzare nella Compressione Audio con Tecniche Neurali

Un nuovo sistema migliora la compressione audio spaziale per un suono più chiaro e un'efficienza maggiore.

2025-09-11T15:19:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato MusiLingo: Unire Musica e Lingua

Un nuovo sistema che collega musica e lingua per una comprensione migliore.

2025-09-11T14:30:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare la qualità del suono negli auricolari

La ricerca svela nuovi modelli per migliorare la chiarezza della voce negli auricolari smart.

2025-09-11T12:04:55+00:00 ― 5 leggere min

Suono Migliorare il riconoscimento dei suoni degli uccelli con i metadati

Usare informazioni extra ci aiuta a riconoscere i canti degli uccelli.

2025-09-11T11:16:20+00:00 ― 6 leggere min

Suono Migliorare la generazione audio attraverso tecniche di allineamento del testo

Un nuovo approccio migliora la generazione audio allineando l'audio con le descrizioni testuali.

2025-09-11T07:13:25+00:00 ― 5 leggere min

Calcolo e linguaggio Progressi nella tecnologia di riconoscimento vocale

I ricercatori lavorano per migliorare il riconoscimento vocale online usando modelli di spazio degli stati strutturati.

2025-09-11T04:47:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Rilevamento in tempo reale dei relatori per le riunioni moderne

Un nuovo sistema migliora le esperienze delle riunioni identificando i relatori in tempo reale.

2025-09-11T03:10:30+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Migliorare le tecniche di rilevamento del discorso falso

Nuovi metodi stanno migliorando la nostra capacità di rilevare il discorso falso in modo efficace.

2025-09-11T02:21:55+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Anonimizzare i Dati Vocali: Un Nuovo Approccio

Un metodo per la conversione della voce che migliora la privacy e la qualità del parlato.

2025-09-11T01:33:20+00:00 ― 7 leggere min

Suono Sviluppi nei sistemi di rilevamento degli audio deepfake

Nuovi metodi migliorano la capacità di distinguere audio falso da quello reale.

2025-09-10T22:19:00+00:00 ― 6 leggere min

Suono Nuovo Metodo per Rilevare il Parlate Sintetico

Un metodo migliora il rilevamento delle voci sintetiche e identifica i loro creatori.

2025-09-10T20:41:50+00:00 ― 5 leggere min

Suono Sviluppi nei Modelli di Miglioramento della Voce Piccoli

Nuovi metodi migliorano i modelli piccoli per un migliore potenziamento del parlato usando meno risorse.

2025-09-10T19:53:15+00:00 ― 6 leggere min

Suono Migliorare il riconoscimento vocale con tecniche di personalizzazione

Un nuovo metodo migliora i modelli ASR per utenti singoli utilizzando quantizzazione e adattamento.

2025-09-10T13:24:35+00:00 ― 6 leggere min

Suono Migliorare l'addestramento del vocoder con l'apprendimento contrastivo

Nuovi metodi migliorano le prestazioni del vocoder con dati audio limitati.

2025-09-10T12:36:00+00:00 ― 5 leggere min

Suono Comprendere la Disartria: Approfondimenti sui Disturbi del Linguaggio

Uno sguardo alla disartria, alla sua rilevazione e al ruolo della tecnologia.

2025-09-10T06:55:55+00:00 ― 6 leggere min

Suono Migliorare il riconoscimento vocale con prompt morbidi

I prompt soft migliorano la tecnologia di riconoscimento vocale per avere prestazioni migliori in ambienti rumorosi.

2025-09-10T04:30:10+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare l'inversione del parlato tramite apprendimento auto-supervisionato

La ricerca combina l'apprendimento auto-supervisionato e nuove tecniche di misurazione per migliorare l'inversione vocale.

2025-09-10T01:15:50+00:00 ― 6 leggere min

Suono Migliorare la chiarezza nella voce elettrolaringea

I ricercatori hanno sviluppato un nuovo framework per migliorare la chiarezza del parlato per gli utenti di elettrolaringei.

2025-09-09T22:50:05+00:00 ― 5 leggere min

Crittografia e sicurezza Migliorare il rilevamento dei deepfake attraverso metodi di allenamento diversi

Questo studio esplora strategie di allenamento per migliorare la rilevazione di audio falsi.

2025-09-09T22:01:30+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nel riconoscimento vocale grazie ai modelli a uscita anticipata

I nuovi modelli si adattano per migliorare l'efficienza e la reattività del riconoscimento vocale.

2025-09-09T21:12:55+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Presentiamo RECAP: Una Nuova Frontiera nel Sottotitolaggio Audio

RECAP usa tecniche avanzate per generare didascalie audio precise senza dover riaddestrare.

2025-09-09T20:24:20+00:00 ― 5 leggere min

Suono Fondamenti di Teoria Musicale e Armonia

Una guida pratica per capire la teoria musicale attraverso l'armonia e le scale.

2025-09-09T16:21:25+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Migliorare i sistemi ASR con dati sintetici

Un nuovo metodo utilizza dati sintetici per migliorare i sistemi ASR in aree poco familiari.

2025-09-09T15:32:50+00:00 ― 7 leggere min

Suono Stimare la densità della folla con il suono proteggendo la privacy

Un nuovo metodo basato sull'audio stima le dimensioni della folla senza invadere la privacy personale.

2025-09-09T13:55:40+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzando nel Riconoscimento Vocale: Sistemi che Seguono Istruzioni

Un nuovo approccio al riconoscimento vocale migliora l'interazione con l'utente grazie a istruzioni flessibili.

2025-09-09T08:15:35+00:00 ― 4 leggere min

Suono Un Nuovo Metodo per Rilevare il Voice Spoofing

Un metodo solido per identificare anomalie audio e combattere il voice spoofing.

2025-09-09T07:27:00+00:00 ― 5 leggere min

Calcolo e linguaggio Sviluppi nel riconoscimento delle emozioni nelle conversazioni

Un nuovo modello migliora la comprensione delle emozioni durante le conversazioni.

2025-09-09T06:38:25+00:00 ― 6 leggere min

Calcolo e linguaggio I simboli del parlato generato da computer seguono la legge di Zipf?

Questo studio esamina se i simboli di linguaggio appresi imitano i modelli di frequenza delle parole.

2025-09-09T04:12:40+00:00 ― 6 leggere min

Suono DiCon: Un Nuovo Approccio alla Sintesi Vocale

Presentiamo un metodo più veloce per la sintesi vocale di alta qualità usando modelli di diffusione.

2025-09-09T03:24:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato HiFTNet: Avanzando la tecnologia Text-to-Speech

HiFTNet offre una sintesi vocale più veloce e di alta qualità usando tecniche innovative ed efficienti.

2025-09-09T02:35:30+00:00 ― 5 leggere min

Suono Progressi nella tecnologia di conversione vocale usando immagini facciali

Un nuovo metodo trasforma le voci usando le caratteristiche facciali per diverse applicazioni.

2025-09-09T01:46:55+00:00 ― 9 leggere min