Un nuovo framework migliora lo studio dei sistemi di riconoscimento vocale non supervisionati.

2025-10-25T13:34:45+00:00 ― 7 leggere min

Suono Creare melodie da ritmi semplici

Questo progetto aiuta chiunque a comporre musica usando ritmi base e metodi informatici avanzati.

2025-10-25T11:57:35+00:00 ― 5 leggere min

Calcolo e linguaggio Progressi nell'Apprendimento Auto-Supervisionato per il Riconoscimento Vocale

I modelli self-supervised svelano cose interessanti sulle distinzioni fonetiche e fonemiche nel parlato.

2025-10-25T10:20:25+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare la responsabilità della polizia con la tecnologia di riconoscimento vocale

La ricerca esplora l'uso del riconoscimento vocale nell'analisi dei filmati delle telecamere indossate dalla polizia.

2025-10-25T07:54:40+00:00 ― 7 leggere min

Suono Nuovi modi in cui i computer creano musica

Uno sguardo a come i computer stanno cambiando la composizione musicale.

2025-10-25T04:31:16+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento e la sintesi emotiva nei modelli vocali

Nuove tecniche migliorano la comprensione emotiva nei compiti di elaborazione del linguaggio.

2025-10-25T01:26:00+00:00 ― 6 leggere min

Suono LinDiff: Un Salto Avanti nella Sintesi Vocale

Il nuovo modello LinDiff migliora la velocità e la qualità della sintesi vocale.

2025-10-25T00:37:25+00:00 ― 5 leggere min

Suono Nuovo metodo trasforma la tecnologia di compressione audio

Un nuovo approccio alla compressione audio riduce le dimensioni dei file senza perdere qualità.

2025-10-24T18:57:20+00:00 ― 5 leggere min

Suono Migliorare la chiarezza del parlato in ambienti rumorosi

Tecniche per migliorare il riconoscimento vocale in mezzo al rumore di fondo.

2025-10-24T16:50:20+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato HiddenSinger: Una Nuova Era nella Sintesi della Voce Cantante

HiddenSinger migliora la qualità della voce cantando usando tecniche avanzate di intelligenza artificiale.

2025-10-24T14:54:25+00:00 ― 6 leggere min

Suono Sviluppi nella tecnologia di conversione vocale elettrolaringea

Nuovi metodi migliorano la chiarezza del parlato per gli utenti di elettrolaringi.

2025-10-24T13:17:15+00:00 ― 6 leggere min

Suono Avanzamenti innovativi nella tecnologia del parlato elettrolaringeo

I ricercatori mescolano caratteristiche visive e sonore per migliorare il linguaggio per gli utenti di elettrolaringe.

2025-10-24T12:28:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato L'impatto dell'età sui sistemi di riconoscimento vocale

Uno studio evidenzia come l'invecchiamento influisca sulle prestazioni della verifica automatica dell'identità vocale.

2025-10-24T10:02:55+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato PauseSpeech: Avanzando la tecnologia Text-to-Speech

PauseSpeech migliora i sistemi TTS con una voce naturale grazie a pause più efficaci.

2025-10-24T09:14:20+00:00 ― 5 leggere min

Multimedia Un Nuovo Sistema per Abbinare Musica e Video

Questa ricerca presenta un sistema per abbinare la musica ai contenuti video in modo efficace.

2025-10-24T07:37:10+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale in ambienti rumorosi

Nuovi metodi migliorano le prestazioni del riconoscimento vocale automatico in mezzo al rumore di fondo.

2025-10-24T02:45:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Gestione Efficiente di Grandi Modelli di Voce

Un nuovo metodo ottimizza i modelli vocali per migliori prestazioni con meno risorse.

2025-10-23T21:54:10+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Nuovo Metodo per la Valutazione Obiettiva dell'Audio Spaziale

Un approccio nuovo migliora il modo in cui valutiamo la qualità dell'audio spaziale.

2025-10-23T19:28:25+00:00 ― 5 leggere min

Suono Identificare il parlato letto vs. il parlato spontaneo nelle interviste

Uno studio su come distinguere tra discorso letto e discorso spontaneo.

2025-10-23T18:39:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato StyleTTS 2: Avanzando la tecnologia Text-to-Speech

Un nuovo modello migliora il realismo del parlato sintetico.

2025-10-23T15:25:30+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel tracciamento delle fonti sonore con PI-RNN

Un nuovo modello migliora l'accuratezza e l'efficienza nel tracciare le fonti sonore.

2025-10-23T10:34:00+00:00 ― 5 leggere min

Calcolo e linguaggio Presentiamo il dataset ITALIC per l'italiano parlato

Un nuovo dataset migliora la comprensione del linguaggio parlato per l'italiano.

2025-10-23T08:56:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nei modelli ASR bilingui e code-switched

Nuovi metodi migliorano il riconoscimento vocale multilingue usando fonti di dati esistenti.

2025-10-23T04:05:20+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale per le lingue a basse risorse

La ricerca si concentra sul miglioramento della tecnologia vocale per lingue che non hanno abbastanza dati.

2025-10-22T23:13:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nelle Tecniche di Miglioramento del Suono

Uno sguardo ai recenti sviluppi per migliorare la chiarezza audio usando modelli avanzati.

2025-10-22T21:36:40+00:00 ― 5 leggere min

Suono Valutare la difficoltà dei pezzi per pianoforte con un nuovo dataset

Un nuovo set di dati punta a classificare i punteggi del pianoforte per livello di difficoltà.

2025-10-22T20:48:05+00:00 ― 7 leggere min

Suono Miglioramenti nella Qualità del Suono

Il framework Gesper migliora la chiarezza del parlato in ambienti rumorosi.

2025-10-22T19:59:30+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il miglioramento del parlato con tecniche di normalizzazione

Questo studio presenta un nuovo metodo per migliorare la qualità del parlato usando modelli già addestrati.

2025-10-22T19:10:55+00:00 ― 6 leggere min

Intelligenza artificiale Migliorare il Riconoscimento del Linguaggio D'odio nei Multimedia

Combinare audio, video e testo migliora il rilevamento dell'odio.

2025-10-22T15:08:00+00:00 ― 6 leggere min

Suono Un Approccio Semplificato al HMM Ibrido per ASR

Questo articolo parla di un nuovo metodo per costruire sistemi ASR efficienti.

2025-10-22T14:19:25+00:00 ― 5 leggere min

Suono Approccio innovativo all'analisi dei numeri romani nella musica

Un nuovo metodo che utilizza le Reti Neurali a Grafi migliora l'analisi dei Numeri Romani per la musica.

2025-10-22T13:26:06+00:00 ― 6 leggere min

Suono Avanzamenti nella rilevazione di eventi bioacustici a pochi colpi

I team migliorano l'identificazione dei suoni degli animali con pochi esempi nella sfida DCASE.

2025-10-22T07:50:45+00:00 ― 6 leggere min

Suono Sfruttare il tagging audio su computer piccoli

Scopri i sistemi di tagging audio e il loro utilizzo su Raspberry Pi.

2025-10-22T06:13:35+00:00 ― 5 leggere min

Suono Avanzamenti negli algoritmi per l'identificazione delle cover

Nuove tecniche migliorano la precisione e l'efficienza nell'identificare le cover.

2025-10-22T05:25:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia di controllo attivo del rumore

Nuovo metodo migliora il controllo del rumore negli spazi 3D.

2025-10-22T01:22:05+00:00 ― 4 leggere min

Suono Valutare la qualità del parlato con modelli di machine learning

Questo studio valuta vari modelli per prevedere la qualità del parlato sintetizzato.

2025-10-21T16:27:40+00:00 ― 6 leggere min

Suono Progressi nei Metodi di Classificazione dei Suoni degli Uccelli

I ricercatori automatizzano la classificazione dei suoni degli uccelli, migliorando l'accuratezza nel monitoraggio delle specie.

2025-10-21T14:50:30+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato FALL-E: Una Nuova Era nella Creazione Sonora

FALL-E crea effetti sonori di alta qualità a partire da descrizioni testuali.

2025-10-21T13:13:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nel riconoscimento vocale multi-parlante con SURT 2.0

SURT 2.0 migliora il riconoscimento vocale per più parlanti in situazioni in tempo reale.

2025-10-21T05:07:30+00:00 ― 6 leggere min

Suono Presentiamo MARBLE: un benchmark per l'AI musicale

MARBLE stabilisce uno standard per valutare i modelli di intelligenza artificiale musicale su più attività.

2025-10-21T04:18:55+00:00 ― 7 leggere min

Informatica - Suono