Ingegneria elettrica e scienze dei sistemi - Elaborazione dell'audio e del parlato

RSS

Suono AffectEcho: Colmare le Emozioni nel Parlare dell'IA

Il modello AffectEcho migliora l'espressione emotiva nel parlato generato dall'IA.

2025-09-25T07:15:30+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare la conversione da grafema a fonema con un nuovo metodo di campionamento

Questo studio migliora i modelli G2P concentrandosi sulle aree soggette a errori durante l'addestramento.

2025-09-25T05:38:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nelle tecniche di tracciamento dei formanti

Scopri metodi che migliorano l'accuratezza nel tracciamento dei formanti per l'analisi del parlato.

2025-09-24T22:21:05+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Usare l'analisi vocale per valutare la gravità del Parkinson

I ricercatori sviluppano metodi basati sulla voce per una valutazione più precisa del morbo di Parkinson.

2025-09-24T21:32:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzare nel Rilevamento Sonoro con Tecniche di Meta-Apprendimento

Meta-SELD migliora la localizzazione degli eventi sonori in ambienti diversi.

2025-09-24T19:55:20+00:00 ― 6 leggere min

Apprendimento automatico Momenti audiovisivi nel tempo: un nuovo dataset per il riconoscimento delle azioni

AVMIT offre ai ricercatori spunti su come suono e visione si collegano nel riconoscimento delle azioni.

2025-09-24T07:46:35+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nella previsione della qualità audio con GML

Un nuovo modello di intelligenza artificiale migliora la previsione dei punteggi di qualità audio.

2025-09-24T03:43:40+00:00 ― 6 leggere min

Suono Generazione di Musica AI: Uno Studio sulle Tecniche di Campionamento

Questa ricerca esamina come i metodi di campionamento influenzano la qualità della musica generata dall'IA.

2025-09-24T02:55:05+00:00 ― 6 leggere min

Suono Progressi nella tecnologia anti-spoofing audio

Un nuovo metodo migliora il rilevamento di audio falso nei sistemi di riconoscimento vocale.

2025-09-23T23:40:45+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nel Beat Tracking per la Musica Classica

Nuovi metodi migliorano l'accuratezza del beat tracking nella musica classica complessa.

2025-09-23T14:46:20+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Capire il Ruolo della Diarizzazione Linguistica

Uno sguardo a come la diarizzazione linguistica aiuta nelle conversazioni multilingue.

2025-09-22T23:23:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel Framework di Generazione della Texture Audio

Un nuovo framework semplifica la generazione di texture audio riducendo il bisogno di etichettatura.

2025-09-22T22:34:40+00:00 ― 6 leggere min

Suono Progressi nel riconoscimento vocale in ambienti rumorosi

Un nuovo sistema migliora il riconoscimento vocale in ambienti rumorosi usando tecniche avanzate.

2025-09-22T21:46:05+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Valutazione delle prestazioni del Baseline B1 della VoicePrivacy Challenge

Valutare l'efficacia dell'anonimizzazione della voce senza perdere il suono naturale.

2025-09-22T14:28:50+00:00 ― 6 leggere min

Suono Sviluppi nella classificazione audio con LCANets++

I nuovi modelli migliorano l'accuratezza della classificazione audio e la resilienza contro il rumore e gli attacchi.

2025-09-22T12:51:40+00:00 ― 5 leggere min

Suono AI nella Musica: Strumenti e Tecniche di Creazione

Una panoramica degli strumenti AI per la creazione musicale e le loro caratteristiche uniche.

2025-09-22T08:48:45+00:00 ― 11 leggere min

Suono Generare suoni realistici da video silenziosi

La ricerca esplora il deep learning per creare audio che si abbini al contenuto video muto.

2025-09-22T04:45:50+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Combinare Suoni e Immagini per Migliorare la Qualità Audio

Un nuovo metodo migliora le registrazioni audio usando indizi visivi.

2025-09-22T03:57:15+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Valutare la qualità del parlato con i modelli XLS-R

Uno sguardo a come i modelli XLS-R migliorano la valutazione della qualità audio nelle riunioni online.

2025-09-22T01:31:30+00:00 ― 6 leggere min

Suono Migliorare il tagging audio con il framework CED

Un nuovo metodo migliora le prestazioni e l'efficienza del tagging audio.

2025-09-22T00:42:55+00:00 ― 5 leggere min

Suono Nuovo studio sulla rilevazione del linguaggio generato dall'IA

Le ricerche evidenziano metodi di rilevamento in tempo reale per audio fasullo creato dall'IA.

2025-09-21T19:02:50+00:00 ― 6 leggere min

Suono Whombat: un nuovo strumento per la ricerca bioacustica

Whombat semplifica l'annotazione delle registrazioni audio per la ricerca sulla fauna selvatica.

2025-09-21T18:14:15+00:00 ― 5 leggere min

Suono Sviluppi nelle tecniche di miglioramento del suono

Nuove strategie migliorano la chiarezza del parlato in ambienti rumorosi per una migliore riconoscibilità.

2025-09-21T17:25:40+00:00 ― 6 leggere min

Multimedia Collegare Emozioni nelle Immagini alla Ricerca Musicale

Un nuovo sistema collega immagini emotive alla musica per una scoperta migliore.

2025-09-21T16:37:05+00:00 ― 6 leggere min

Suono Migliorare la qualità della musica per registrazioni quotidiane

Un nuovo sistema migliora le registrazioni audio per esperienze di ascolto migliori.

2025-09-21T15:48:30+00:00 ― 6 leggere min

Suono Migliorare la bioacustica con tecniche di apprendimento attivo

Un nuovo approccio riduce etichettatura dei dati mentre migliora la precisione nella classificazione audio.

2025-09-21T14:11:20+00:00 ― 5 leggere min

Suono Sviluppi nella tecnologia Text-to-Speech per un linguaggio più naturale

Un nuovo sistema migliora la qualità del parlato e l'espressività per la sintesi dei paragrafi.

2025-09-21T11:45:35+00:00 ― 5 leggere min

Suono Valutare la qualità della musica generata dall'IA

Scopri metodi per valutare la qualità della musica creata dall'AI attraverso valutazioni soggettive e oggettive.

2025-09-21T10:08:25+00:00 ― 5 leggere min

Suono Nuove scoperte sul movimento della lingua durante il parlato

La ricerca si concentra sui movimenti della lingua per aiutare la logopedia e l'apprendimento delle lingue.

2025-09-21T04:28:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Impatto di genere sui sistemi biometrici vocali

Questo studio analizza come il genere influisce sull'utilizzo, la privacy e l'equità dei biometrics vocali.

2025-09-20T19:33:55+00:00 ― 7 leggere min

Suono Migliorare la Sintesi Vocale con Tecniche di Potatura

Nuovi metodi di potatura migliorano le prestazioni del modello text-to-speech multi-parlante zero-shot.

2025-09-20T15:31:00+00:00 ― 7 leggere min

Calcolo e linguaggio Comprendere le emozioni nelle conversazioni d'emergenza

La ricerca sul riconoscimento delle emozioni nelle interazioni delle chiamate di emergenza rivela intuizioni importanti.

2025-09-20T14:42:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nell'Apprendimento Autosupervisionato per il Riconoscimento Vocale

Nuovi metodi per selezionare dati vocali riducono il labeling mentre migliorano la precisione del riconoscimento.

2025-09-20T13:53:50+00:00 ― 5 leggere min

Suono Avanzando il Riconoscimento delle Emozioni nella Voce con il Trasformatore Tempo-Frequenza

Un nuovo metodo migliora il riconoscimento delle emozioni nel linguaggio analizzando tempo e frequenza.

2025-09-20T12:16:40+00:00 ― 6 leggere min

Fisica quantistica La tecnologia quantistica incontra la creazione musicale

Esplora come gli strumenti quantistici trasformano la produzione musicale per gli artisti.

2025-09-20T08:57:42+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la Valutazione della Qualità del Parlato con Punteggi di Preferenza

Un nuovo metodo migliora il ranking della qualità del parlato usando i punteggi di preferenza degli ascoltatori.

2025-09-20T07:25:10+00:00 ― 5 leggere min

Suono Migliorare il riconoscimento vocale per chi balbetta

Un metodo per migliorare i sistemi ASR per utenti che balbettano.

2025-09-20T06:36:35+00:00 ― 5 leggere min

Suono Problemi di accesso nel Million Song Dataset

Le difficoltà nell'accesso ai dati audio ostacolano le opportunità di ricerca.

2025-09-20T00:07:55+00:00 ― 5 leggere min

Suono Progressi nella tecnologia di isolamento vocale

Nuovi metodi migliorano la chiarezza in ambienti rumorosi grazie a un'elaborazione del suono avanzata.

2025-09-19T22:30:45+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Improvement nella tecnologia di sintesi vocale francese

Un nuovo sistema sviluppato genera discorsi francesi realistici per una competizione.

2025-09-19T21:42:10+00:00 ― 6 leggere min