Ingegneria elettrica e scienze dei sistemi - Elaborazione dell'audio e del parlato

RSS

Suono Evoluzioni nel riconoscere parole di parte nel linguaggio

CB-Conformer migliora il riconoscimento vocale per parole biasate con tecniche innovative.

2025-11-19T11:57:50+00:00 ― 5 leggere min

Crittografia e sicurezza Assistenti Vocali: Trovare il Giusto Equilibrio tra Comodità e Rischi

Esplora le sfide di sicurezza e privacy della tecnologia degli assistenti vocali.

2025-11-19T09:32:05+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzando il riconoscimento vocale per i dialetti svizzeri tedeschi

Migliorare i modelli di riconoscimento vocale per il tedesco svizzero usando tecniche avanzate e dataset.

2025-11-19T04:40:35+00:00 ― 5 leggere min

Suono Approfondimenti sulle allucinazioni uditive verbali tramite la tecnologia mobile

Lo studio esplora come i dati mobili aiutano a capire le allucinazioni uditive verbali.

2025-11-19T03:52:00+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Difendere il Riconoscimento Automatico del Parlato dagli Attacchi Adversariali Audiovisivi

Un nuovo metodo migliora le difese contro attacchi audio avversari nei sistemi di riconoscimento vocale.

2025-11-18T22:11:55+00:00 ― 6 leggere min

Suono Sviluppi nella tecnologia di riconoscimento delle parole chiave

La ricerca si concentra su modelli efficienti per il riconoscimento delle parole chiave utilizzando reti snodabili.

2025-11-18T19:46:10+00:00 ― 5 leggere min

Suono CLaMP: Un Nuovo Approccio al Recupero Musicale

CLaMP combina musica e linguaggio per la classificazione e la ricerca automatica della musica.

2025-11-18T15:43:15+00:00 ― 6 leggere min

Suono Misurare la Bellezza nella Musica: Un Nuovo Approccio

Un metodo matematico per valutare la bellezza delle performance musicali.

2025-11-18T07:37:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel riconoscimento delle emozioni vocali con modelli pre-addestrati

Scopri come i modelli pre-addestrati migliorano la tecnologia del riconoscimento delle emozioni nel parlato.

2025-11-18T06:48:50+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Progressi nella tecnologia di morphing della texture audio

Un nuovo metodo migliora il morphing della texture audio per un design sonoro creativo.

2025-11-17T21:05:50+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzare nella creazione audio tramite descrizioni testuali

Un nuovo metodo genera audio da testo usando modelli moderni.

2025-11-17T15:25:45+00:00 ― 5 leggere min

Suono DCASE 2023: Avanzare nella Sintesi Automatica dei Suoni Foley

Una competizione per migliorare la creazione automatica di suoni Foley per il multimedia.

2025-11-17T14:37:10+00:00 ― 5 leggere min

Suono Avanzare nella classificazione musicale con le playlist

Questo studio esplora come usare le playlist per migliorare la classificazione e la somiglianza della musica.

2025-11-17T10:34:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzando il Riconoscimento del Suono con Apprendimento Semi-Supervisionato

Un nuovo metodo migliora il rilevamento del suono usando dati etichettati e non etichettati.

2025-11-17T08:08:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Tecniche Avanzate di Miglioramento del Parlato

Un nuovo metodo combina la voce pulita e le informazioni sul rumore per una chiarezza migliore.

2025-11-16T13:31:05+00:00 ― 5 leggere min

Suono Avanzamenti nel Riconoscimento Vocale Automatico con Deep Transfer Learning

Come il Deep Transfer Learning trasforma le tecnologie di Riconoscimento Automatico del Parlato.

2025-11-15T23:45:10+00:00 ― 6 leggere min

Suono Un nuovo metodo per separare le voci nella musica

La tecnologia innovativa separa le voci musicali usando tecniche di tracciamento avanzate.

2025-11-15T11:36:25+00:00 ― 6 leggere min

Apprendimento automatico Nuovo metodo per monitorare le mucche in ambienti rumorosi

Ora gli agricoltori possono tracciare con precisione i comportamenti delle mucche nonostante il rumore di fondo.

2025-11-15T09:59:15+00:00 ― 7 leggere min

Suono Sviluppi nella trascrizione musicale automatica usando dati sintetizzati

Nuovi metodi nella trascrizione musicale mostrano potenzialità con dati audio sintetizzati.

2025-11-15T04:19:10+00:00 ― 6 leggere min

Suono Analizzando i pianti dei bebè: il dataset CryCeleb

Un grande dataset di pianti dei neonati aiuta a capire la comunicazione e la salute infantile.

2025-11-15T02:42:00+00:00 ― 6 leggere min

Suono Migliorare il riconoscimento delle parole chiave con CosMix

Un nuovo metodo migliora i sistemi di rilevamento delle parole chiave in condizioni a basso consumo di risorse.

2025-11-14T21:50:30+00:00 ― 5 leggere min

Suono Miglioramenti nelle previsioni del controllo del traffico aereo con il framework SIA-FTP

Un nuovo framework migliora le previsioni delle traiettorie di volo utilizzando istruzioni vocali in tempo reale.

2025-11-14T10:30:20+00:00 ― 4 leggere min

Suono Migliorare il Captioning Audio con un Nuovo Metodo di Loss

Un nuovo metodo migliora la didascalia audio generando frasi più chiare e varie.

2025-11-14T09:41:45+00:00 ― 4 leggere min

Suono LORIS: Un Nuovo Approccio alla Generazione di Musica Video

LORIS genera musica di alta qualità che si sincronizza perfettamente con i movimenti dei video.

2025-11-14T05:38:50+00:00 ― 6 leggere min

Calcolo e linguaggio Le reti neurali imparano la sintassi dal suono

Uno studio mostra che le CNN possono creare combinazioni di parole da dati vocali grezzi.

2025-11-14T02:24:30+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato PLiX: Un Nuovo Approccio al Riconoscimento Vocale

PLiX usa il few-shot learning per migliorare il riconoscimento vocale in più lingue.

2025-11-13T23:10:10+00:00 ― 8 leggere min

Suono Avanzamenti nella Rilevazione di Eventi Sonori Usando il Few-Shot Learning

Questo articolo parla di come migliorare il rilevamento delle sequenze sonore nel riconoscimento audio.

2025-11-13T20:44:25+00:00 ― 6 leggere min

Calcolo e linguaggio Impatto della Qualità Audio sull'Apprendimento delle Lingue Ricerca

Uno studio rivela come la chiarezza audio influisce sull'analisi dell'acquisizione linguistica nei neonati.

2025-11-13T14:15:45+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Nuovo Strumento di Simulazione Acustica per Posizionamento Indoor

Uno strumento migliora i sistemi di posizionamento interni basati sul suono tramite simulazioni efficienti.

2025-11-13T10:12:50+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzamenti nei sistemi di comprensione del linguaggio parlato

Un nuovo approccio migliora la comprensione del linguaggio parlato usando un'elaborazione audio efficiente.

2025-11-13T02:07:00+00:00 ― 6 leggere min

Suono Migliorare l'efficienza delle CNN tramite potatura dei filtri

Questo documento presenta un metodo per migliorare le CNN rimuovendo filtri inutili.

2025-11-12T15:35:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Bilanciare Velocità e Accuratezza nel Riconoscimento Vocale

Un nuovo approccio migliora il riconoscimento vocale in tempo reale bilanciando velocità e precisione.

2025-11-12T13:09:40+00:00 ― 7 leggere min

Calcolo e linguaggio Presentiamo X-LLM: Un Nuovo Modello Linguistico Multimodale

X-LLM integra immagini, video e discorsi nel trattamento del linguaggio.

2025-11-12T11:32:30+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzamenti nel riconoscimento delle emozioni nella voce

Un nuovo metodo migliora il rilevamento delle emozioni nel parlato usando tecniche di self-attention.

2025-11-12T06:41:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Fast Conformer: Avanzando nel Riconoscimento Vocale

Fast Conformer migliora la velocità e l'accuratezza del riconoscimento vocale per diverse applicazioni.

2025-11-11T20:09:25+00:00 ― 5 leggere min

Calcolo e linguaggio Collegare l'elaborazione del parlato e l'elaborazione del linguaggio naturale

Unire linguaggio parlato e scritto per modelli di comunicazione migliori.

2025-11-11T16:06:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nella tecnologia da parlato a canto

La ricerca presenta un metodo per convertire parole parlate in canto in modo efficiente.

2025-11-11T12:52:10+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Tecnologia del linguaggio e rischi per la privacy

Esaminando l'impatto della tecnologia vocale sulla privacy personale.

2025-11-11T11:15:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato QVoice: Il tuo partner nella pronuncia araba

Un'app mobile pensata per migliorare la pronuncia araba per tutti gli studenti.

2025-11-11T08:49:15+00:00 ― 5 leggere min

Suono Riparare le lacune nell'audio del parlato con l'apprendimento automatico

Questo articolo parla di come il machine learning colma le lacune nell'audio vocale.

2025-11-11T07:12:05+00:00 ― 6 leggere min