Ingegneria elettrica e scienze dei sistemi - Elaborazione dell'audio e del parlato

RSS

Calcolo e linguaggio Nuovi metodi nella traduzione simultanea del parlato

Migliorare la traduzione in tempo reale attraverso tecniche di segmentazione avanzate.

2025-09-07T18:12:10+00:00 ― 5 leggere min

Calcolo e linguaggio Progressi nella traduzione simultanea del parlato

Migliorare le traduzioni in tempo reale con metodi innovativi e politiche intelligenti.

2025-09-07T17:23:35+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppo del Riconoscimento Automatico del Parlato per l'Arabo Tunisino

Sforzi per migliorare i sistemi ASR per l'arabo tunisino e il code-switching.

2025-09-07T16:35:00+00:00 ― 5 leggere min

Suono Personalizzazione della generazione musicale: nuovi approcci

Metodi innovativi puntano a personalizzare la generazione musicale secondo le preferenze degli utenti.

2025-09-07T15:46:25+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Presentiamo il Modello SPGM per la Separazione del Parlato

Un nuovo modello migliora l'efficienza e le prestazioni nella separazione del parlato.

2025-09-07T10:54:55+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Nuovo modello migliora la valutazione della qualità audio

Un nuovo approccio valuta la qualità audio usando più microfoni in diversi ambienti.

2025-09-07T08:29:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nelle tecniche di separazione del suono

Un nuovo metodo migliora la separazione dei suoni tra diverse frequenze.

2025-09-07T06:03:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la comunicazione vocale con la cancellazione dell'eco acustico

Esplora i progressi nella cancellazione dell'eco per migliorare la qualità delle chiamate.

2025-09-07T05:14:50+00:00 ― 4 leggere min

Suono Avanzamenti nella Sintesi Musicale Multi-Strumento

Un nuovo metodo migliora la generazione musicale aggiungendo il contesto della performance.

2025-09-07T01:11:55+00:00 ― 6 leggere min

Suono Un metodo innovativo trasforma la didascalia audio con dati testuali

Un nuovo approccio genera didascalie audio usando solo testo, migliorando l'efficienza dei dati.

2025-09-07T00:23:20+00:00 ― 7 leggere min

Suono Collegare la musica: Recupero audio e spartiti

Esplorare le sfide e le innovazioni nel matchare registrazioni audio con spartiti.

2025-09-06T21:57:35+00:00 ― 6 leggere min

Suono Avanzare nel recupero musicale con l'apprendimento auto-supervisionato

Un nuovo approccio sfrutta l'apprendimento auto-supervisionato per collegare audio e spartiti.

2025-09-06T21:09:00+00:00 ― 5 leggere min

Suono Collegare Audio e Partitura con Reti Ricorrenti

Un nuovo metodo migliora il matching tra audio e spartiti.

2025-09-06T19:31:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare i dataset audio con il clustering K-Means

Usare il clustering k-means per ottimizzare i dati audio per un miglior addestramento del modello.

2025-09-06T15:28:55+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con tecniche di aumento audio

Uno studio mostra che l'augmented audio può migliorare il riconoscimento vocale nelle lingue a bassa risorsa.

2025-09-06T09:48:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzare nel Riconoscimento Automatico del Parlato Multilingue con Mascheramento Adattivo

Un nuovo approccio migliora l'efficienza nei modelli ASR multilingue integrando tecniche di mascheramento adattivo.

2025-09-06T09:00:15+00:00 ― 5 leggere min

Suono Usare l'audio Deepfake per migliorare i sistemi di trascrizione

Indagando sull'audio deepfake per migliorare i modelli di trascrizione per lingue meno comuni.

2025-09-06T07:23:05+00:00 ― 8 leggere min

Apprendimento automatico Migliorare l'apprendimento con etichette deboli tramite la selezione di esempi negativi

Nuove strategie migliorano l'apprendimento con etichette deboli selezionando esempi negativi rilevanti.

2025-09-06T04:57:20+00:00 ― 6 leggere min

Suono Nuova tecnica di watermarks per modelli audio

Un nuovo metodo per aggiungere filigrane all'audio creato da modelli di diffusione per proteggere la proprietà.

2025-09-06T04:08:45+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con le reti di memoria

Nuove tecniche migliorano i sistemi ASR per riconoscere meglio discorsi lunghi.

2025-09-06T03:20:10+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nei Sistemi di Riconoscimento delle Parole Chiave

Nuove tecniche puntano a migliorare l'accuratezza dei dispositivi attivati dalla voce contro gli attacchi.

2025-09-06T01:43:00+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato DurIAN-E: Avanzando la tecnologia Text-to-Speech

DurIAN-E migliora il parlato sintetico con un'espressività e un fluire naturale potenziati.

2025-09-06T00:54:25+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia di riconoscimento delle emozioni vocali

Scopri come SER migliora le interazioni uomo-macchina grazie al rilevamento delle emozioni.

2025-09-06T00:05:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Selezione Efficiente del Modello per il Riconoscimento Vocale

Un metodo per scegliere il miglior modello ASR basato sulle caratteristiche audio.

2025-09-05T23:17:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la chiarezza del discorso con tecniche di dereverberazione

Scopri come la dereverberazione migliora il riconoscimento vocale in ambienti rumorosi.

2025-09-05T12:45:40+00:00 ― 4 leggere min

Suono Presentiamo Coco-Nut: un database vocale completo per il TTS

Coco-Nut offre diversi campioni vocali giapponesi per applicazioni avanzate di sintesi vocale.

2025-09-05T11:57:05+00:00 ― 10 leggere min

Elaborazione dell'audio e del parlato Nuovo Metodo per la Stima del Volume delle Stanze Usando Modelli di Attenzione

Questo studio presenta un modello basato sull'attenzione per stimare i volumi delle stanze da registrazioni audio.

2025-09-05T11:08:30+00:00 ― 5 leggere min

Suono Presentiamo ASCA: Un Nuovo Approccio alla Classificazione Audio

Il modello ASCA migliora l'accuratezza della classificazione audio per set di dati piccoli.

2025-09-05T10:19:55+00:00 ― 6 leggere min

Calcolo e linguaggio Il mio progetto di tutoraggio di scienze: un nuovo modo di imparare

MyST punta a migliorare l'apprendimento della scienza nei bambini attraverso tutoraggio virtuale.

2025-09-05T09:31:20+00:00 ― 5 leggere min

Suono Valutare la localizzazione degli eventi sonori con diverse configurazioni audio

Lo studio confronta l'accuratezza nella localizzazione del suono tra formati audio a quattro canali e a due canali.

2025-09-05T08:42:45+00:00 ― 6 leggere min

Suono Sviluppi nella tecnologia di trascrizione delle riunioni

Uno sguardo a M2MeT 2.0 e il suo impatto sulla trascrizione delle riunioni.

2025-09-05T03:51:15+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nell'Anonimizzazione degli Speaker usando Codec Audio Neurali

Un nuovo metodo di elaborazione audio migliora l'anonimato del parlante mantenendo la chiarezza del discorso.

2025-09-05T01:25:30+00:00 ― 6 leggere min

Suono Trasformare i movimenti della lingua in suoni parla

Questo studio trasforma i dati della risonanza magnetica della lingua in audio vocale reale.

2025-09-04T22:11:10+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Progressi e sfide nei modelli di riconoscimento vocale

Questo studio analizza come la compressione dei modelli influisce sul riconoscimento vocale in ambienti rumorosi.

2025-09-04T19:45:25+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella Rilevazione di Eventi Sonori con OAL

Esplora come l'Apprendimento Attivo Online migliori l'efficienza nel riconoscimento dei suoni.

2025-09-04T18:56:50+00:00 ― 6 leggere min

Suono Sviluppi nei modelli di riconoscimento audio e vocale

Un nuovo modello migliora la comprensione del parlato e dei suoni contemporaneamente.

2025-09-04T18:08:15+00:00 ― 6 leggere min

Apprendimento automatico Classificazione Automatica nell'Intervista Motivazionale

Un sistema che classifica il linguaggio dei clienti nelle sedute di terapia usando vari metodi di comunicazione.

2025-09-04T16:31:05+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Progressi nella rilevazione della disartria usando il machine learning

Nuova tecnologia migliora la rilevazione della disartria e la classificazione della gravità.

2025-09-04T11:39:35+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella detección della patologia vocale

Nuovi metodi migliorano la rilevazione precoce dei problemi vocali usando le caratteristiche della sorgente glottale.

2025-09-04T10:02:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale per accenti diversi

Migliorare i modelli di riconoscimento vocale per capire e adattarsi meglio ai diversi accenti.

2025-09-04T08:25:15+00:00 ― 5 leggere min