Ingegneria elettrica e scienze dei sistemi - Elaborazione dell'audio e del parlato

RSS

Suono Avanzando i metodi di rilevamento dell'audio deepfake

La ricerca si concentra sul rilevamento dell'audio deepfake attraverso tecniche migliorate e l'espansione dei dati.

2025-07-01T06:28:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Nuove innovazioni nella tecnologia di sintesi vocale

Un nuovo metodo migliora la sintesi vocale naturale tra le lingue.

2025-07-01T04:50:50+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare il rilevamento dei deepfake con dettagli fini

Un nuovo approccio si concentra su piccole incoerenze nella rilevazione dei deepfake.

2025-07-01T04:02:15+00:00 ― 6 leggere min

Calcolo e linguaggio Velocità del discorso: Il ruolo della lunghezza delle frasi e dei fattori sociali

Esaminando come la lunghezza dell'utterance e i fattori sociali influenzano il ritmo del parlato.

2025-07-01T03:13:40+00:00 ― 5 leggere min

Calcolo e linguaggio Valutare il bias nei modelli di linguaggio

Un nuovo dataset mette in evidenza i pregiudizi nei modelli di linguaggio basati su genere ed età.

2025-06-30T19:07:50+00:00 ― 7 leggere min

Crittografia e sicurezza Tecnologie Avanzate nei Sistemi di Rilevamento Intrusioni

Esplorare il ruolo dei Transformer e dei LLM nel migliorare la sicurezza della rete.

2025-06-30T17:30:40+00:00 ― 8 leggere min

Suono PeriodWave: Un Nuovo Approccio alla Generazione di Waveform

Presentiamo PeriodWave, un modello che migliora la velocità e la qualità della generazione audio.

2025-06-30T15:53:30+00:00 ― 6 leggere min

Suono Una Guida per Inviare Articoli Scientifici

Impara a preparare e presentare il tuo articolo scientifico in modo efficace.

2025-06-30T12:39:10+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Sviluppi nell'Audio e nel Processamento Linguistico

Il nuovo modello migliora i collegamenti tra i suoni e i loro significati testuali.

2025-06-30T08:36:15+00:00 ― 7 leggere min

Suono L'evoluzione sonora della musica popolare

Uno sguardo a come le caratteristiche sonore nella musica popolare siano cambiate nel corso dei decenni.

2025-06-30T01:19:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con parole chiave contestuali

Un nuovo sistema migliora il riconoscimento vocale usando parole chiave contestuali per una maggiore precisione.

2025-06-29T22:53:15+00:00 ― 6 leggere min

Suono PeriodWave-Turbo: Una Nuova Era nella Generazione del Suono

PeriodWave-Turbo migliora la velocità e la qualità della generazione del suono in diverse applicazioni.

2025-06-29T22:04:40+00:00 ― 5 leggere min

Calcolo e linguaggio Progressi nei modelli vocali grazie a tecniche di potatura

La ricerca mostra come rendere i modelli di linguaggio più piccoli ed efficienti.

2025-06-29T16:24:35+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la Chiarezza nell'Audio: Tecniche di Separazione dei Dialoghi

La separazione dei dialoghi aiuta gli spettatori a sentire chiaramente le conversazioni in mezzo al rumore di fondo.

2025-06-29T11:33:05+00:00 ― 6 leggere min

Suono Progresso nella Rilevazione di Eventi Sonori con MAT-SED

MAT-SED usa un nuovo modello Transformer per una rilevazione efficace degli eventi sonori.

2025-06-29T09:55:55+00:00 ― 5 leggere min

Suono Un nuovo approccio alla diagnosi dei suoni cardiaci

Combinare i suoni cardiaci e l'ecocardiografia per migliorare la diagnosi delle malattie cardiache congénite.

2025-06-29T09:07:20+00:00 ― 6 leggere min

Suono GAPS: Una nuova risorsa per la ricerca sulla chitarra classica

Un ricco set di dati di registrazioni di chitarra collegate a spartiti musicali per ricerca e analisi.

2025-06-29T07:30:10+00:00 ― 4 leggere min

Interazione uomo-macchina Migliorare la localizzazione del suono in XR con Auptimize

Auptimize migliora il posizionamento degli segnali audio per un'interazione utente migliore in XR.

2025-06-29T04:15:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Malacopula: Una Nuova Minaccia ai Sistemi di Verifica Vocale

Malacopula mette in dubbio l'affidabilità delle tecnologie di verifica automatica degli speaker.

2025-06-29T03:27:15+00:00 ― 6 leggere min

Grafica MetaFace: Avanzando le animazioni di facce parlate in 3D

Un nuovo metodo per animazioni facciali 3D più realistiche che si adattano agli stili di parlato personali.

2025-06-28T19:21:25+00:00 ― 5 leggere min

Suono Migliorare il riconoscimento delle parole chiave con l'addestramento avversario

L'addestramento avversariale migliora l'accuratezza del riconoscimento delle parole chiave nel parlato sintetico e reale.

2025-06-28T13:41:20+00:00 ― 5 leggere min

Suono Progressi nel Few-Shot Learning per l'elaborazione audio

Questo pezzo parla del few-shot learning e del suo impatto sui task audio.

2025-06-28T12:04:10+00:00 ― 7 leggere min

Suono Trasformare la comunicazione: Conversione vocale basata sul viso

Una nuova tecnologia collega i tratti del viso alla voce, aiutando la comunicazione per chi non può parlare.

2025-06-28T06:24:05+00:00 ― 5 leggere min

Apprendimento automatico Avanzamenti nell'apprendimento compositivo audio

Un nuovo metodo migliora la separazione e generazione audio senza dati etichettati.

2025-06-28T05:35:30+00:00 ― 6 leggere min

Suono ASVspoof Challenge: Sviluppi nell'autenticazione vocale

Affrontare le sfide dell'audio falso e della verifica dell'oratore.

2025-06-28T00:44:00+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare la pronuncia per chi non è madrelingua

Un nuovo sistema migliora la chiarezza del parlato per gli studenti di lingue, concentrandosi sull'allenamento dell'accento.

2025-06-27T23:55:25+00:00 ― 5 leggere min

Suono Classificare la rage music: un approccio di machine learning

Analizzare le caratteristiche della musica rage attraverso il machine learning per una migliore classificazione dei generi.

2025-06-27T20:41:05+00:00 ― 5 leggere min

Suono L'ascesa dell'audio falsificato e le sfide nella rilevazione

I falsi audio sono un problema serio; metodi di rilevamento efficaci sono essenziali.

2025-06-27T19:52:30+00:00 ― 6 leggere min

Suono Migliorare il rilevamento di audio falso con la quantizzazione dei colori

Un nuovo metodo migliora l'accuratezza nel rilevare audio sintetico.

2025-06-27T19:03:55+00:00 ― 6 leggere min

Suono DisMix: Trasformare la Manipolazione Musicale

Un nuovo metodo per separare e manipolare suoni musicali.

2025-06-27T17:26:45+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nella tecnologia di sintesi vocale con SSL-TTS

SSL-TTS semplifica la sintesi vocale usando pochi dati di addestramento per risultati di alta qualità.

2025-06-27T15:49:35+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale multilingue senza dati originali

Nuovi metodi migliorano i modelli ASR per più lingue, preservando le conoscenze passate.

2025-06-27T15:01:00+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale bilingue con XCB

Un nuovo approccio migliora il riconoscimento delle frasi con cambio di codice nel linguaggio bilingue.

2025-06-27T11:46:40+00:00 ― 6 leggere min

Suono Video-Foley: Trasformare il Suono nel Design Multimediale

Un sistema innovativo automatizza la generazione di suoni per film e giochi.

2025-06-26T23:37:55+00:00 ― 8 leggere min

Suono Sviluppi nella tecnologia di verifica vocale

Nuovi metodi migliorano il riconoscimento vocale in ambienti rumorosi.

2025-06-26T18:46:25+00:00 ― 5 leggere min

Suono Progressi nella tecnologia di conversione vocale zero-shot

Il nuovo modello migliora la conversione vocale, specialmente per il parlato sussurrato e le applicazioni in tempo reale.

2025-06-26T17:57:50+00:00 ― 6 leggere min

Suono Uno sguardo nuovo sulla modellazione degli amplificatori per chitarra

Esplorando un nuovo approccio digitale alla modellazione del suono degli amplificatori per chitarra.

2025-06-26T16:20:40+00:00 ― 5 leggere min

Suono GaMaDHaNi: Un Nuovo Sistema per le Melodie Hindustani

Presentiamo un sistema rivoluzionario per generare musica vocale hindustani.

2025-06-26T11:29:10+00:00 ― 7 leggere min

Suono Sviluppi nei modelli di compressori di gamma dinamica con reti neurali

Un nuovo metodo per modellare con precisione i compressori ottici usando reti neurali.

2025-06-26T10:40:35+00:00 ― 8 leggere min

Interazione uomo-macchina WhisperMask: Un Cambiamento Epocale nella Comunicazione Vocale

WhisperMask cattura la voce chiaramente nei posti rumorosi, migliorando la comunicazione.

2025-06-26T09:03:25+00:00 ― 6 leggere min