Ingegneria elettrica e scienze dei sistemi - Elaborazione dell'audio e del parlato

RSS

Suono Progressi nella tecnologia di sintesi vocale emotiva

Il nuovo modello ZET-Speech migliora la sintesi vocale emozionale per diversi speaker.

2025-11-03T23:29:30+00:00 ― 5 leggere min

Suono Avanzamenti nella trascrizione della musica per pianoforte e violino

Uno studio trova che nuove tecniche di missaggio migliorano l'accuratezza della trascrizione musicale.

2025-11-03T21:52:20+00:00 ― 4 leggere min

Suono Avanzare l'interazione uomo-macchina con dialoghi empatici

Un nuovo metodo migliora le risposte delle macchine attraverso una migliore comprensione emotiva.

2025-11-03T21:03:45+00:00 ― 6 leggere min

Suono Migliorare il Riconoscimento Vocale in Situazioni con più Parlanti

Un nuovo metodo migliora l'accuratezza nel riconoscimento vocale automatico per le riunioni.

2025-11-03T20:15:10+00:00 ― 6 leggere min

Suono Sviluppare assistenti vocali empatici con CALLS

CALLS punta a migliorare la capacità degli assistenti vocali di gestire le interazioni con i clienti.

2025-11-03T19:26:35+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nella tecnologia di ricostruzione audio

Nuovi metodi migliorano il restauro audio e la qualità di produzione.

2025-11-03T17:49:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nella quantizzazione per modelli di riconoscimento vocale

La ricerca migliora le tecniche di quantizzazione per aumentare l'efficienza dei modelli di riconoscimento vocale.

2025-11-03T11:20:45+00:00 ― 8 leggere min

Suono Rivoluzionare la Misurazione della Qualità Audio con PLCMOS

PLCMOS offre un nuovo modo per valutare la qualità del suono senza ascoltatori umani.

2025-11-03T10:32:10+00:00 ― 6 leggere min

Interazione uomo-macchina LoopBoxes: Un Nuovo Modo di Fare Musica

LoopBoxes aiuta i bambini a creare musica in modo semplice e collaborativo.

2025-11-03T08:55:00+00:00 ― 6 leggere min

Suono Sintesi Sonora Innovativa Usando Reti Neurali

Un nuovo metodo per creare suoni d'impatto realistici tramite reti neurali.

2025-11-03T08:06:25+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale per i non madrelingua

Una nuova tecnica migliora i sistemi ASR per riconoscere meglio gli accenti non nativi.

2025-11-03T02:26:20+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzare nel riconoscimento vocale con l'apprendimento debolmente supervisionato

Nuovi metodi sfruttano l'identità del parlante per migliorare le prestazioni del riconoscimento vocale.

2025-11-03T01:37:45+00:00 ― 5 leggere min

Suono Migliorare il Riconoscimento Vocale con l'Approccio Sidecar

Un nuovo metodo combina il riconoscimento vocale e l'identificazione del parlante per il discorso sovrapposto.

2025-11-03T00:49:10+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzando la traduzione simultanea del discorso con DiSeg

Un nuovo metodo migliora la qualità e l'efficienza della traduzione in tempo reale.

2025-11-03T00:00:35+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il Few-Shot Learning con il meccanismo di attenzione

Un nuovo approccio migliora il machine learning con meno esempi e dati multimodali.

2025-11-02T22:23:25+00:00 ― 6 leggere min

Suono Stimare le Risposte all'Impatto delle Stanze con Più Sorgenti Sonore

Un nuovo metodo per stimare le risposte delle stanze in ambienti sonori complessi.

2025-11-02T21:34:50+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Progressi nella tecnologia di conversione vocale

Un nuovo metodo per la conversione della voce migliora la chiarezza e l'adattamento.

2025-11-02T19:57:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzando il testo in voce per le lingue turche

Costruire sistemi TTS per lingue turche meno conosciute utilizzando dati kazaki.

2025-11-02T18:20:30+00:00 ― 5 leggere min

Suono Presentiamo MeLoDy: Generazione di Musica Veloce Svelata

MeLoDy genera rapidamente musica di alta qualità da testi.

2025-11-02T17:31:55+00:00 ― 5 leggere min

Suono Affrontare le minacce alla sicurezza nei sistemi di riconoscimento vocale

Nuovi metodi emergono per proteggere il riconoscimento vocale dagli attacchi avversari.

2025-11-02T16:43:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Presentiamo AudioDec: Una Nuova Era nello Streaming Audio

AudioDec offre audio di alta qualità in tempo reale con basso consumo di dati.

2025-11-02T15:06:10+00:00 ― 5 leggere min

Suono Nuovo metodo rivela i rischi per la privacy nei modelli di diffusione

Una nuova tecnica controlla l'esposizione ai dati di addestramento nei modelli di diffusione.

2025-11-02T13:29:00+00:00 ― 5 leggere min

Suono Avanzamenti nella separazione del parlato con S4M

Un nuovo modello migliora l'isolamento vocale in ambienti rumorosi.

2025-11-02T10:14:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Riprodurre il suono del nastro magnetico con strumenti digitali

Questo articolo parla di come ricreare il suono delle cassette magnetiche usando la tecnologia digitale.

2025-11-02T09:26:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella tecnologia di sintesi vocale

Nuovo framework migliora la qualità della voce nella sintesi vocale.

2025-11-02T06:11:45+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nelle Voci Sintetiche Personalizzate

I ricercatori sviluppano tecnologia per ricreare voci uniche per chi ha problemi di parola.

2025-11-01T23:43:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare la Verifica del Parlante con il Metodo OS-KDFT

Un nuovo metodo migliora la verifica dell'identità del parlante combinando la distillazione della conoscenza e il fine-tuning.

2025-11-01T22:05:55+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato DeCoR: Un Nuovo Metodo per l'Apprendimento Audio

DeCoR aiuta le macchine a imparare suoni nuovi senza dimenticare quelli vecchi.

2025-11-01T21:17:20+00:00 ― 5 leggere min

Suono Progressi nel tagging audio in tempo reale

I trasformatori audio in streaming migliorano la velocità e l'efficienza nei sistemi di tagging audio.

2025-11-01T20:28:45+00:00 ― 6 leggere min

Calcolo e linguaggio Sviluppi nei Metodi di Trascrizione Vocale

Nuove tecniche migliorano l'accuratezza e la velocità nella conversione della voce in testo.

2025-11-01T16:25:50+00:00 ― 6 leggere min

Suono Valutare il linguaggio disartrico: nuovi metodi per la chiarezza

Questa ricerca presenta valutazioni migliorate per una comunicazione più chiara nelle persone con disartria.

2025-11-01T15:37:15+00:00 ― 6 leggere min

Suono Affrontare le sfide nel riconoscimento vocale con parole enharmoniche

Un nuovo metodo migliora il riconoscimento vocale per nomi che suonano simili.

2025-11-01T14:48:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare la Diversità del Parlato nei Sistemi TTS

Un nuovo metodo migliora la naturalezza e la varietà dell'output da testo a parlato.

2025-11-01T13:11:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella classificazione audio con l'adattatore Treff

L'adattatore Treff migliora la classificazione audio con pochi dati etichettati.

2025-11-01T12:22:55+00:00 ― 5 leggere min

Apprendimento automatico Progressi nell'apprendimento auto-supervisionato multi-task

Nuovi metodi migliorano la flessibilità e le prestazioni del modello nei compiti audio.

2025-11-01T08:20:00+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nel Riconoscimento delle Emozioni nella Voce Usando Embeddings del Parlante

La ricerca mette in evidenza metodi efficaci per riconoscere le emozioni nel parlato usando gli embedding.

2025-11-01T07:31:25+00:00 ― 6 leggere min

Suono Tagging audio in modo efficiente con E-PANNs

Scopri come gli E-PANN migliorano l'efficienza nel riconoscimento dei suoni.

2025-11-01T04:17:05+00:00 ― 5 leggere min

Calcolo e linguaggio Analizzare i dialetti tramite l'elaborazione audio

Questa ricerca analizza i dialetti usando registrazioni audio per rivelare le loro somiglianze.

2025-11-01T02:39:55+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzare nella comprensione del linguaggio parlato con unità discrete

Nuovo metodo migliora la comprensione del linguaggio parlato senza bisogno di trascrizioni scritte.

2025-11-01T00:14:10+00:00 ― 6 leggere min

Suono Progressi nelle Tecniche di Classificazione Audio

Un nuovo metodo migliora la classificazione audio imparando nuovi suoni in modo efficiente.

2025-10-31T22:37:00+00:00 ― 4 leggere min