Articoli più recenti per Elaborazione Audio

Apprendimento automatico Sfide nell'uso dei Convnets per la progettazione di filtri audio

Questo studio esplora i problemi legati all'uso delle convnet per la creazione di filterbank audio.

2025-09-14T14:34:35+00:00 ― 5 leggere min

Suono Sviluppi nei modelli audio e linguistici

Il modello CLAP collega l'elaborazione audio e testuale per diverse applicazioni.

2025-09-14T13:46:00+00:00 ― 4 leggere min

Suono Nuovo sistema migliora l'estrazione della voce da posizioni della testa instabili

PIAVE aiuta le macchine a estrarre le voci in modo chiaro, anche quando i parlanti girano la testa.

2025-09-12T19:39:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare la chiarezza del parlato con la tecnologia AV2Wav

AV2Wav migliora la qualità del parlato usando segnali audio e visivi.

2025-09-12T17:13:55+00:00 ― 5 leggere min

Suono Un nuovo sistema per l'anonimizzazione degli speaker

Introducendo un framework flessibile per migliorare la ricerca sulla privacy vocale.

2025-09-12T05:05:10+00:00 ― 7 leggere min

Suono Le sfide emotive mettono alla prova i modelli di separazione del parlato

Le ricerche mostrano che il discorso emotivo influisce sulle performance dei modelli nei compiti di separazione del parlato.

2025-09-11T18:33:35+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Migliorare le tecniche di rilevamento del discorso falso

Nuovi metodi stanno migliorando la nostra capacità di rilevare il discorso falso in modo efficace.

2025-09-11T02:21:55+00:00 ― 6 leggere min

Suono Migliorare l'addestramento del vocoder con l'apprendimento contrastivo

Nuovi metodi migliorano le prestazioni del vocoder con dati audio limitati.

2025-09-10T12:36:00+00:00 ― 5 leggere min

Suono Un Nuovo Metodo per Rilevare il Voice Spoofing

Un metodo solido per identificare anomalie audio e combattere il voice spoofing.

2025-09-09T07:27:00+00:00 ― 5 leggere min

Suono DiCon: Un Nuovo Approccio alla Sintesi Vocale

Presentiamo un metodo più veloce per la sintesi vocale di alta qualità usando modelli di diffusione.

2025-09-09T03:24:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato HiFTNet: Avanzando la tecnologia Text-to-Speech

HiFTNet offre una sintesi vocale più veloce e di alta qualità usando tecniche innovative ed efficienti.

2025-09-09T02:35:30+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Presentiamo AV-SUPERB: un nuovo punto di riferimento per i modelli audio-visivi

AV-SUPERB valuta modelli audio e visivi su vari task per migliorare le prestazioni.

2025-09-08T22:32:35+00:00 ― 6 leggere min

Suono Generazione veloce di testo in audio usando la distillazione della coerenza

Nuovo metodo migliora la velocità e l'efficienza nella generazione da testo a audio.

2025-09-08T18:29:40+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Presentiamo il Modello SPGM per la Separazione del Parlato

Un nuovo modello migliora l'efficienza e le prestazioni nella separazione del parlato.

2025-09-07T10:54:55+00:00 ― 5 leggere min

Suono Un metodo innovativo trasforma la didascalia audio con dati testuali

Un nuovo approccio genera didascalie audio usando solo testo, migliorando l'efficienza dei dati.

2025-09-07T00:23:20+00:00 ― 7 leggere min

Suono Collegare la musica: Recupero audio e spartiti

Esplorare le sfide e le innovazioni nel matchare registrazioni audio con spartiti.

2025-09-06T21:57:35+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare i dataset audio con il clustering K-Means

Usare il clustering k-means per ottimizzare i dati audio per un miglior addestramento del modello.

2025-09-06T15:28:55+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con tecniche di aumento audio

Uno studio mostra che l'augmented audio può migliorare il riconoscimento vocale nelle lingue a bassa risorsa.

2025-09-06T09:48:50+00:00 ― 6 leggere min

Apprendimento automatico Migliorare l'apprendimento con etichette deboli tramite la selezione di esempi negativi

Nuove strategie migliorano l'apprendimento con etichette deboli selezionando esempi negativi rilevanti.

2025-09-06T04:57:20+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Selezione Efficiente del Modello per il Riconoscimento Vocale

Un metodo per scegliere il miglior modello ASR basato sulle caratteristiche audio.

2025-09-05T23:17:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la chiarezza del discorso con tecniche di dereverberazione

Scopri come la dereverberazione migliora il riconoscimento vocale in ambienti rumorosi.

2025-09-05T12:45:40+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Nuovo Metodo per la Stima del Volume delle Stanze Usando Modelli di Attenzione

Questo studio presenta un modello basato sull'attenzione per stimare i volumi delle stanze da registrazioni audio.

2025-09-05T11:08:30+00:00 ― 5 leggere min

Suono Presentiamo ASCA: Un Nuovo Approccio alla Classificazione Audio

Il modello ASCA migliora l'accuratezza della classificazione audio per set di dati piccoli.

2025-09-05T10:19:55+00:00 ― 6 leggere min

Suono Trasformare i movimenti della lingua in suoni parla

Questo studio trasforma i dati della risonanza magnetica della lingua in audio vocale reale.

2025-09-04T22:11:10+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Progressi e sfide nei modelli di riconoscimento vocale

Questo studio analizza come la compressione dei modelli influisce sul riconoscimento vocale in ambienti rumorosi.

2025-09-04T19:45:25+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella Rilevazione di Eventi Sonori con OAL

Esplora come l'Apprendimento Attivo Online migliori l'efficienza nel riconoscimento dei suoni.

2025-09-04T18:56:50+00:00 ― 6 leggere min

Suono Sviluppi nei modelli di riconoscimento audio e vocale

Un nuovo modello migliora la comprensione del parlato e dei suoni contemporaneamente.

2025-09-04T18:08:15+00:00 ― 6 leggere min

Suono Sviluppi nella classificazione audio usando DCLS

DCLS migliora le performance di classificazione audio imparando le posizioni dei kernel durante l'addestramento.

2025-09-04T07:36:40+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare l'apprendimento audio-visivo con la co-augmentazione della velocità

Un nuovo metodo migliora l'apprendimento automatico dei dati audio-visivi.

2025-09-04T05:59:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato MC-SimCLR: Avanzando l'apprendimento sonoro e la consapevolezza della posizione

Un nuovo metodo migliora il riconoscimento dei suoni e la localizzazione delle fonti senza etichette.

2025-09-03T00:50:30+00:00 ― 6 leggere min

Suono Nuove intuizioni sulla generalizzazione nelle reti neurali

Esplorando come la nitidezza dei minimi influisca sulle prestazioni del modello su dati audio non visti.

2025-09-02T15:56:05+00:00 ― 5 leggere min

Suono Transformers nella rappresentazione musicale

Uno studio sull'uso dei transformer per un tagging e una rappresentazione musicale efficace.

2025-09-02T07:01:40+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Un Approccio Universale al Miglioramento del Parlato

Questa ricerca presenta un modello per migliorare la chiarezza del discorso in diverse condizioni.

2025-09-02T02:10:10+00:00 ― 5 leggere min

Suono L'Ascesa dei Sottotitoli Audio Automatici

Esplorando i progressi nella didascalia audio automatica e il suo impatto sull'accessibilità.

2025-09-02T01:21:35+00:00 ― 5 leggere min

Suono Progressi nelle tecniche di ancoraggio testo-audio

Nuovi metodi migliorano il collegamento tra descrizioni testuali e eventi sonori.

2025-08-31T16:09:40+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella diarizzazione degli speaker con il metodo E-SHARC

E-SHARC migliora l'identificazione degli speaker in vari ambienti audio.

2025-08-28T06:22:45+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Avanzamento della segmentazione audio-visiva con tecniche non supervisionate

Un nuovo approccio semplifica la segmentazione audio-visiva senza bisogno di costosi dati etichettati.

2025-08-27T01:00:18+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Nuovo metodo per eliminare la voce eco

Un metodo migliora la chiarezza del parlato in ambienti rumorosi senza dati di addestramento chiari.

2025-08-26T17:56:30+00:00 ― 6 leggere min

Analisi funzionale Wavelet e Liscezza: Un'Intuizione Pratica

Esplora il ruolo delle wavelet nell'analizzare la liscezza delle funzioni e le sue applicazioni.

2025-08-24T23:53:28+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare la Diarizzazione degli Speaker con Approcci Multi-Microfono

Nuovi metodi migliorano il rilevamento dell'attività vocale e delle sovrapposizioni nella diarizzazione degli oratori.

2025-08-24T13:18:35+00:00 ― 7 leggere min