Informatica - Suono

RSS

Suono Tecniche avanzate di anti-spoofing audio

Uno studio migliora i modelli di verifica dell'identità per una protezione migliore.

2025-10-30T15:02:15+00:00 ― 6 leggere min

Calcolo e linguaggio Sviluppi nei Sistemi di Risposta a Domande Audio

I nuovi modelli migliorano il modo in cui le macchine rispondono a domande audio.

2025-10-30T13:25:05+00:00 ― 5 leggere min

Calcolo e linguaggio Sviluppi nella sintesi vocale in svizzero tedesco

Nuovi metodi migliorano la sintesi vocale per il tedesco svizzero partendo da testi in tedesco standard.

2025-10-30T10:59:20+00:00 ― 5 leggere min

Suono Avanzando il Riconoscimento dell'Attività Vocale con SVVAD

Scopri come SVVAD migliora il rilevamento dell'attività vocale per una verifica del parlante migliore.

2025-10-30T09:22:10+00:00 ― 5 leggere min

Suono Progressi nella Valutazione Automatica della Pronuncia

Un nuovo metodo migliora il feedback sulla pronuncia per chi impara le lingue.

2025-10-30T08:33:35+00:00 ― 6 leggere min

Calcolo e linguaggio Misurare l'adattabilità nei modelli di riconoscimento vocale

Un nuovo framework valuta quanto bene i modelli di linguaggio si adattano a compiti specifici.

2025-10-30T06:56:25+00:00 ― 6 leggere min

Suono Avanzare nel processamento del linguaggio con HuBERT

I modelli HuBERT migliorano i compiti di riconoscimento vocale usando più risoluzioni per performance migliori.

2025-10-29T22:02:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia di identificazione degli altoparlanti

Nuove tecniche migliorano la precisione nel riconoscere i parlanti e nel rilevare impostori.

2025-10-29T20:24:50+00:00 ― 5 leggere min

Suono Migliorare gli effetti audio virtual analog con il deep learning

Un nuovo approccio migliora la risposta di fase negli effetti audio virtuali usando il deep learning.

2025-10-29T18:47:40+00:00 ― 5 leggere min

Suono Rallentamento nel Riconoscimento Vocale: Uno Sguardo Più Vicoloso a SlothSpeech

SlothSpeech svela vulnerabilità nei sistemi di riconoscimento vocale, rallentandoli parecchio.

2025-10-29T17:10:30+00:00 ― 5 leggere min

Suono UnDiff: Un Nuovo Approccio alla Chiarezza Audio

UnDiff migliora la qualità audio usando tecniche innovative di ripristino del parlato.

2025-10-29T16:21:55+00:00 ― 6 leggere min

Suono Progressi nella tecnologia per la rilevazione della balbuzie

Nuovi metodi nel machine learning migliorano le capacità di rilevamento della balbuzie.

2025-10-29T14:44:45+00:00 ― 5 leggere min

Suono EmoMix: Avanzando nella Sintesi Vocale Emozionale

EmoMix permette di creare discorsi che esprimono emozioni miste con una precisione nell'intensità.

2025-10-29T13:56:10+00:00 ― 5 leggere min

Suono MW-MAE: Un Nuovo Approccio all'Apprendimento Audio

Scopri il metodo innovativo del Multi-Window Masked Autoencoder per un'elaborazione audio migliorata.

2025-10-29T11:30:25+00:00 ― 5 leggere min

Suono Migliorare il ripristino audio con indizi visivi

Un nuovo metodo unisce dati audio e visivi per riparare il linguaggio mancante.

2025-10-29T10:41:50+00:00 ― 6 leggere min

Calcolo e linguaggio Affrontare l'odio nei linguaggi a bassa risorsa

Esplorare metodi per rilevare discorsi d'odio in trasmissioni audio di lingue poco risorse.

2025-10-29T09:04:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Rivitalizzare il Suono: Il Metodo BABE per il Restauro Audio

Un nuovo metodo ripristina le alte frequenze perse nelle registrazioni storiche.

2025-10-29T06:38:55+00:00 ― 7 leggere min

Suono Avanzare la simulazione del suono con BEDRF

Un nuovo modello migliora la diffrazione del suono negli ambienti virtuali.

2025-10-29T01:47:25+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale con il bias contestuale

Il bias contestuale migliora i sistemi ASR, aumentando l'accuratezza in compiti specializzati.

2025-10-29T00:58:50+00:00 ― 6 leggere min

Suono Nuovo metodo per migliorare il rilevamento della pronuncia delle lingue

Questo studio presenta un nuovo sistema per rilevare gli errori di pronuncia nei studenti di lingue.

2025-10-28T21:44:30+00:00 ― 6 leggere min

Suono Un Nuovo Approccio alla Riorganizzazione Musicale

Il sistema Q A usa l'apprendimento auto-supervisionato per un arrangiamento musicale innovativo.

2025-10-28T20:07:20+00:00 ― 6 leggere min

Suono Migliorare la sintesi vocale espressiva con TVC-GMM

Un nuovo metodo migliora la qualità del testo in voce e l'espressione emotiva.

2025-10-28T18:30:10+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzare nel riconoscimento vocale con modelli più piccoli

Stanno uscendo tecniche per ridurre le dimensioni dei modelli mantenendo le prestazioni.

2025-10-28T15:15:50+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Avanzamenti negli effetti di phasing digitale

Nuovo modello imita gli effetti di fase analogici con tecniche di apprendimento migliorate.

2025-10-28T12:50:05+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzando nel riconoscimento vocale multilingue con DistilXLSR

Un nuovo modello riduce le dimensioni migliorando al contempo il riconoscimento vocale multilingue.

2025-10-28T11:12:55+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale per accenti diversi

Un nuovo metodo migliora l'accuratezza del riconoscimento vocale per gli accenti africani.

2025-10-28T09:35:45+00:00 ― 5 leggere min

Calcolo e linguaggio Progressi nel riconoscimento vocale per più relatori

Un nuovo sistema migliora il riconoscimento vocale in situazioni con più relatori.

2025-10-28T00:41:20+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nella tecnologia Lip-to-Speech

LipVoicer genera discorsi chiari da video silenziosi utilizzando metodi avanzati di lettura labiale.

2025-10-27T21:27:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzando il riconoscimento della voce disartrica con approcci innovativi

Nuovi metodi puntano a migliorare la comunicazione per le persone con disartria.

2025-10-27T21:01:09+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzare le previsioni con più punteggi nei processi gaussiani

Nuovo metodo migliora le previsioni considerando più punteggi di esperti.

2025-10-27T19:49:50+00:00 ― 6 leggere min

Calcolo e linguaggio Valutare le prestazioni di Whisper sui dialetti arabi

Uno sguardo a come Whisper gestisce vari dialetti e accenti arabi.

2025-10-27T13:21:10+00:00 ― 5 leggere min

Calcolo e linguaggio Video-LLaMA: Un Nuovo Approccio alla Comprensione dei Video

Un programma che combina dati visivi e audio per migliorare la comprensione dei video.

2025-10-27T11:44:00+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzare nel riconoscimento degli atti linguistici in bengalese

Un nuovo metodo migliora il riconoscimento degli atti linguistici in bengalese usando analisi audio e testuale.

2025-10-27T10:55:25+00:00 ― 5 leggere min

Suono Analizzare la musica con BERT: un nuovo approccio

La ricerca esplora il potenziale di BERT nell'analisi musicale a livello di bar.

2025-10-27T07:41:05+00:00 ― 5 leggere min

Computer e società Apprendimento della matematica coinvolgente per i bambini piccoli

Un nuovo sistema migliora l'apprendimento della matematica a casa tramite interazioni divertenti.

2025-10-27T07:08:49+00:00 ― 6 leggere min

Calcolo e linguaggio Adattamento Efficiente del Riconoscimento Vocale Usando Dati Testuali

Un nuovo metodo migliora i modelli di riconoscimento vocale usando solo dati testuali per l'adattamento.

2025-10-27T06:52:30+00:00 ― 5 leggere min

Suono Avanzare nella armonizzazione delle melodie con un contesto emotivo

Un nuovo modello migliora l'armonizzazione delle melodie considerando fattori emotivi.

2025-10-26T21:58:05+00:00 ― 6 leggere min

Apprendimento automatico Creazione di Danza Innovativa usando Parole Sonore

Nuovi metodi usano onomatopee per ispirare movimenti di danza unici.

2025-10-26T20:20:55+00:00 ― 5 leggere min

Suono Avanzamenti nei sistemi di contromisure vocali

I ricercatori migliorano il riconoscimento del parlato generato da macchine usando aggiustamenti delle informazioni di fase.

2025-10-26T17:55:10+00:00 ― 6 leggere min

Calcolo e linguaggio Progressi nell'identificazione delle lingue con il framework LASR

Un nuovo approccio migliora l'identificazione della lingua parlata usando l'apprendimento auto-supervisionato e etichette.

2025-10-26T08:12:10+00:00 ― 6 leggere min