Informatica - Suono

RSS

Suono Identificare il parlato letto vs. il parlato spontaneo nelle interviste

Uno studio su come distinguere tra discorso letto e discorso spontaneo.

2025-10-23T18:39:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato StyleTTS 2: Avanzando la tecnologia Text-to-Speech

Un nuovo modello migliora il realismo del parlato sintetico.

2025-10-23T15:25:30+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel tracciamento delle fonti sonore con PI-RNN

Un nuovo modello migliora l'accuratezza e l'efficienza nel tracciare le fonti sonore.

2025-10-23T10:34:00+00:00 ― 5 leggere min

Calcolo e linguaggio Presentiamo il dataset ITALIC per l'italiano parlato

Un nuovo dataset migliora la comprensione del linguaggio parlato per l'italiano.

2025-10-23T08:56:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nei modelli ASR bilingui e code-switched

Nuovi metodi migliorano il riconoscimento vocale multilingue usando fonti di dati esistenti.

2025-10-23T04:05:20+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale per le lingue a basse risorse

La ricerca si concentra sul miglioramento della tecnologia vocale per lingue che non hanno abbastanza dati.

2025-10-22T23:13:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nelle Tecniche di Miglioramento del Suono

Uno sguardo ai recenti sviluppi per migliorare la chiarezza audio usando modelli avanzati.

2025-10-22T21:36:40+00:00 ― 5 leggere min

Suono Valutare la difficoltà dei pezzi per pianoforte con un nuovo dataset

Un nuovo set di dati punta a classificare i punteggi del pianoforte per livello di difficoltà.

2025-10-22T20:48:05+00:00 ― 7 leggere min

Suono Miglioramenti nella Qualità del Suono

Il framework Gesper migliora la chiarezza del parlato in ambienti rumorosi.

2025-10-22T19:59:30+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il miglioramento del parlato con tecniche di normalizzazione

Questo studio presenta un nuovo metodo per migliorare la qualità del parlato usando modelli già addestrati.

2025-10-22T19:10:55+00:00 ― 6 leggere min

Intelligenza artificiale Migliorare il Riconoscimento del Linguaggio D'odio nei Multimedia

Combinare audio, video e testo migliora il rilevamento dell'odio.

2025-10-22T15:08:00+00:00 ― 6 leggere min

Suono Un Approccio Semplificato al HMM Ibrido per ASR

Questo articolo parla di un nuovo metodo per costruire sistemi ASR efficienti.

2025-10-22T14:19:25+00:00 ― 5 leggere min

Suono Approccio innovativo all'analisi dei numeri romani nella musica

Un nuovo metodo che utilizza le Reti Neurali a Grafi migliora l'analisi dei Numeri Romani per la musica.

2025-10-22T13:26:06+00:00 ― 6 leggere min

Suono Avanzamenti nella rilevazione di eventi bioacustici a pochi colpi

I team migliorano l'identificazione dei suoni degli animali con pochi esempi nella sfida DCASE.

2025-10-22T07:50:45+00:00 ― 6 leggere min

Suono Sfruttare il tagging audio su computer piccoli

Scopri i sistemi di tagging audio e il loro utilizzo su Raspberry Pi.

2025-10-22T06:13:35+00:00 ― 5 leggere min

Suono Avanzamenti negli algoritmi per l'identificazione delle cover

Nuove tecniche migliorano la precisione e l'efficienza nell'identificare le cover.

2025-10-22T05:25:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia di controllo attivo del rumore

Nuovo metodo migliora il controllo del rumore negli spazi 3D.

2025-10-22T01:22:05+00:00 ― 4 leggere min

Suono Valutare la qualità del parlato con modelli di machine learning

Questo studio valuta vari modelli per prevedere la qualità del parlato sintetizzato.

2025-10-21T16:27:40+00:00 ― 6 leggere min

Suono Progressi nei Metodi di Classificazione dei Suoni degli Uccelli

I ricercatori automatizzano la classificazione dei suoni degli uccelli, migliorando l'accuratezza nel monitoraggio delle specie.

2025-10-21T14:50:30+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato FALL-E: Una Nuova Era nella Creazione Sonora

FALL-E crea effetti sonori di alta qualità a partire da descrizioni testuali.

2025-10-21T13:13:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nel riconoscimento vocale multi-parlante con SURT 2.0

SURT 2.0 migliora il riconoscimento vocale per più parlanti in situazioni in tempo reale.

2025-10-21T05:07:30+00:00 ― 6 leggere min

Suono Presentiamo MARBLE: un benchmark per l'AI musicale

MARBLE stabilisce uno standard per valutare i modelli di intelligenza artificiale musicale su più attività.

2025-10-21T04:18:55+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Nuovo modello migliora il riconoscimento dei suoni degli uccelli

Un nuovo metodo migliora l'accuratezza nell'identificare i canti degli uccelli.

2025-10-21T03:30:20+00:00 ― 6 leggere min

Suono Migliorare l'elaborazione audio con i livelli SFI

Nuovi algoritmi migliorano le prestazioni di elaborazione audio su diverse frequenze di campionamento.

2025-10-21T00:16:00+00:00 ― 5 leggere min

Suono Usare il suono per separare i maschi delle zanzare per il controllo dei parassiti

La ricerca esplora l'analisi sonora per migliorare la selezione delle zanzare per il controllo delle malattie.

2025-10-20T21:50:15+00:00 ― 5 leggere min

Suono Trasformare i suoni vocali con tecniche DSP

Esplora due metodi innovativi per modificare il timbro vocale usando il Digital Signal Processing.

2025-10-20T14:33:00+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel riconoscimento vocale automatico

Un nuovo metodo migliora la tecnologia di riconoscimento vocale senza perdere le conoscenze apprese in precedenza.

2025-10-20T13:44:25+00:00 ― 6 leggere min

Suono Avanzamenti nella trascrizione musicale multitraccia con Perceiver TF

Un nuovo modello migliora l'accuratezza della trascrizione musicale per più strumenti.

2025-10-20T12:07:15+00:00 ― 6 leggere min

Suono Progressi nel processamento audio con DAMAS-FISTA

Un nuovo metodo combina apprendimento tradizionale e profondo per un'imaging del suono efficiente.

2025-10-20T11:18:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella Ricostruzione del Campo Sonoro

Nuovi metodi migliorano il realismo nelle tecnologie audio usando tecniche informate dalla fisica.

2025-10-20T10:30:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Il ruolo del riconoscimento vocale nell'integrità delle sperimentazioni cliniche

Indagando su come la tecnologia vocale può prevenire la partecipazione duplicata dei pazienti negli studi clinici.

2025-10-20T07:15:45+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Analizzare il linguaggio per rilevare problemi di salute mentale

Un nuovo dataset aiuta a identificare segni di depressione e ansia attraverso l'analisi del parlato.

2025-10-20T06:27:10+00:00 ― 7 leggere min

Suono Ricostruire il suono dall'attività cerebrale

Nuovo metodo ricostruisce il suono dai segnali cerebrali, rivelando intuizioni sul processamento uditivo.

2025-10-20T01:35:40+00:00 ― 5 leggere min

Suono Portare l'IA nella creazione musicale su Bela

Una guida per usare modelli AI per la musica sulla piattaforma Bela.

2025-10-19T22:21:20+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare la qualità dell'ASR senza testi di riferimento

NoRefER offre un modo nuovo per valutare i risultati del riconoscimento vocale senza bisogno di trascrizioni.

2025-10-19T16:41:15+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare i sottotitoli dei video con integrazione audio

Quest'articolo parla di un metodo per migliorare i sottotitoli dei video incorporando l'audio.

2025-10-19T15:52:40+00:00 ― 6 leggere min

Suono Sviluppi nella tecnologia di conversione vocale

Un nuovo modello migliora la conversione vocale semplificando le tecniche di separazione del parlato.

2025-10-19T12:38:20+00:00 ― 7 leggere min

Suono Progressi nella Misurazione della Somiglianza Musicale

La ricerca punta a combinare dati audio e simbolici per analizzare la somiglianza musicale.

2025-10-19T11:49:45+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Progressi nelle tecniche di diarizzazione del linguaggio parlato

Nuovi metodi migliorano la segmentazione del parlato nelle conversazioni multilingue.

2025-10-19T02:06:45+00:00 ― 6 leggere min

Suono Nuovo metodo migliora l'isolamento acustico in ambienti rumorosi

NoisyILRMA migliora l'estrazione del suono dal rumore di fondo per un'esperienza audio più chiara.

2025-10-19T00:29:35+00:00 ― 4 leggere min