La ricerca su nuovi modelli migliora la qualità audio nei film e nella televisione.

2025-07-03T17:34:35+00:00 ― 6 leggere min

Grafica Avanzando nella Generazione di Gesti per Umani Virtuali

DiM-Gesture crea gesti realistici sincronizzati con il parlato per le interazioni digitali.

2025-07-03T15:23:54+00:00 ― 5 leggere min

Applicazioni Monitoraggio delle vocalizzazioni infantili: intuizioni sullo sviluppo del linguaggio

Analizzare i suoni di un bambino rivela fasi cruciali della crescita del linguaggio.

2025-07-03T15:13:32+00:00 ― 6 leggere min

Suono Migliorare le RNN per la modellazione degli effetti audio

Nuovi metodi per un miglior controllo delle RNN migliorano le simulazioni degli effetti audio.

2025-07-03T15:08:50+00:00 ― 9 leggere min

Suono Presentiamo MulliVC: Sistema di Conversione Vocale di Nuova Generazione

MulliVC trasforma le voci tra le lingue con una precisione e chiarezza impressionanti.

2025-07-03T11:54:30+00:00 ― 5 leggere min

Suono NeuralMultiling: Un Nuovo Approccio alla Verifica del Parlante

Un sistema che permette l'autenticazione vocale in più lingue per dispositivi mobili.

2025-07-03T08:40:10+00:00 ― 6 leggere min

Suono Rivoluzionare la creazione musicale con TEAdapter

TEAdapter migliora la generazione di musica da testo, dando agli utenti maggiore controllo e creatività.

2025-07-02T17:17:05+00:00 ― 5 leggere min

Suono Migliorare il rilevamento dei suoni anomali con l'apprendimento attivo

Un nuovo framework migliora il rilevamento dei suoni delle macchine usando tecniche di apprendimento attivo.

2025-07-02T13:14:10+00:00 ― 5 leggere min

Calcolo e linguaggio L'impatto dei metodi di annotazione sulla sintesi vocale

Questo studio esamina come diversi metodi di sintesi influenzano qualità e contenuto.

2025-07-02T05:56:55+00:00 ― 5 leggere min

Suono Sviluppi nella separazione delle sorgenti audio con RQ-VAE

Nuovo modello di machine learning migliora le tecniche di separazione delle sorgenti audio.

2025-07-02T05:08:20+00:00 ― 5 leggere min

Suono Music2Latent: Un Nuovo Strumento per la Compressione Audio

Music2Latent semplifica la compressione audio mantenendo un'alta qualità per vari utilizzi.

2025-07-02T04:19:45+00:00 ― 6 leggere min

Calcolo e linguaggio Il nuovo modello TOGGL migliora la trascrizione vocale

Il modello TOGGL migliora l'accuratezza della trascrizione in situazioni di discorso sovrapposto.

2025-07-02T03:31:10+00:00 ― 5 leggere min

Suono Nuovo metodo migliora la chiarezza del parlato negli occhiali smart

Un sistema per migliorare la chiarezza del parlato in ambienti rumorosi usando occhiali smart.

2025-07-02T02:42:35+00:00 ― 5 leggere min

Calcolo e linguaggio Rilevare Discorso d'Odio nell'Audio: Nuovi Approcci

Uno studio per identificare i momenti di discorso d'odio nell'audio usando tecniche innovative.

2025-07-02T00:16:50+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale con l'apprendimento della rappresentazione del rumore contestuale

Un metodo per migliorare la qualità del riconoscimento vocale in ambienti rumorosi.

2025-07-01T23:28:15+00:00 ― 7 leggere min

Suono Controllare la sorpresa musicale nella composizione

Un metodo per generare musica coinvolgente gestendo i livelli di sorpresa.

2025-07-01T22:39:40+00:00 ― 5 leggere min

Informatica neurale ed evolutiva Nuovo framework per l'elaborazione dei segnali neurali

Un nuovo approccio codifica e ricostruisce segnali sensoriali usando treni di impulsi.

2025-07-01T21:02:30+00:00 ― 7 leggere min

Suono Prevedere le emozioni nella musica per il marketing

Questo articolo parla di come usare il deep learning per prevedere le reazioni emotive alla musica.

2025-07-01T10:30:55+00:00 ― 6 leggere min

Suono Mappare i Suoni del Nostro Mondo

Un nuovo metodo per visualizzare le distribuzioni sonore globali usando dati audio e satellitari.

2025-07-01T08:53:45+00:00 ― 6 leggere min

Suono Progressi nella tecnologia di codifica audio e vocale

Esplorare nuovi metodi nella compressione audio per una qualità del suono migliore.

2025-07-01T07:16:35+00:00 ― 7 leggere min

Suono Avanzando i metodi di rilevamento dell'audio deepfake

La ricerca si concentra sul rilevamento dell'audio deepfake attraverso tecniche migliorate e l'espansione dei dati.

2025-07-01T06:28:00+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare il rilevamento dei deepfake con dettagli fini

Un nuovo approccio si concentra su piccole incoerenze nella rilevazione dei deepfake.

2025-07-01T04:02:15+00:00 ― 6 leggere min

Calcolo e linguaggio Velocità del discorso: Il ruolo della lunghezza delle frasi e dei fattori sociali

Esaminando come la lunghezza dell'utterance e i fattori sociali influenzano il ritmo del parlato.

2025-07-01T03:13:40+00:00 ― 5 leggere min

Suono PeriodWave: Un Nuovo Approccio alla Generazione di Waveform

Presentiamo PeriodWave, un modello che migliora la velocità e la qualità della generazione audio.

2025-06-30T15:53:30+00:00 ― 6 leggere min

Suono Una Guida per Inviare Articoli Scientifici

Impara a preparare e presentare il tuo articolo scientifico in modo efficace.

2025-06-30T12:39:10+00:00 ― 7 leggere min

Suono L'evoluzione sonora della musica popolare

Uno sguardo a come le caratteristiche sonore nella musica popolare siano cambiate nel corso dei decenni.

2025-06-30T01:19:00+00:00 ― 5 leggere min

Suono Avanzamento della creazione di tablature per chitarra con il deep learning

Un nuovo sistema migliora la creazione di tablature per chitarra usando metodi di deep learning.

2025-06-29T22:55:06+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con parole chiave contestuali

Un nuovo sistema migliora il riconoscimento vocale usando parole chiave contestuali per una maggiore precisione.

2025-06-29T22:53:15+00:00 ― 6 leggere min

Suono PeriodWave-Turbo: Una Nuova Era nella Generazione del Suono

PeriodWave-Turbo migliora la velocità e la qualità della generazione del suono in diverse applicazioni.

2025-06-29T22:04:40+00:00 ― 5 leggere min

Calcolo e linguaggio Progressi nei modelli vocali grazie a tecniche di potatura

La ricerca mostra come rendere i modelli di linguaggio più piccoli ed efficienti.

2025-06-29T16:24:35+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la Chiarezza nell'Audio: Tecniche di Separazione dei Dialoghi

La separazione dei dialoghi aiuta gli spettatori a sentire chiaramente le conversazioni in mezzo al rumore di fondo.

2025-06-29T11:33:05+00:00 ― 6 leggere min

Suono Progresso nella Rilevazione di Eventi Sonori con MAT-SED

MAT-SED usa un nuovo modello Transformer per una rilevazione efficace degli eventi sonori.

2025-06-29T09:55:55+00:00 ― 5 leggere min

Suono Un nuovo approccio alla diagnosi dei suoni cardiaci

Combinare i suoni cardiaci e l'ecocardiografia per migliorare la diagnosi delle malattie cardiache congénite.

2025-06-29T09:07:20+00:00 ― 6 leggere min

Suono GAPS: Una nuova risorsa per la ricerca sulla chitarra classica

Un ricco set di dati di registrazioni di chitarra collegate a spartiti musicali per ricerca e analisi.

2025-06-29T07:30:10+00:00 ― 4 leggere min

Interazione uomo-macchina Migliorare la localizzazione del suono in XR con Auptimize

Auptimize migliora il posizionamento degli segnali audio per un'interazione utente migliore in XR.

2025-06-29T04:15:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Malacopula: Una Nuova Minaccia ai Sistemi di Verifica Vocale

Malacopula mette in dubbio l'affidabilità delle tecnologie di verifica automatica degli speaker.

2025-06-29T03:27:15+00:00 ― 6 leggere min

Grafica MetaFace: Avanzando le animazioni di facce parlate in 3D

Un nuovo metodo per animazioni facciali 3D più realistiche che si adattano agli stili di parlato personali.

2025-06-28T19:21:25+00:00 ― 5 leggere min

Suono Migliorare il riconoscimento delle parole chiave con l'addestramento avversario

L'addestramento avversariale migliora l'accuratezza del riconoscimento delle parole chiave nel parlato sintetico e reale.

2025-06-28T13:41:20+00:00 ― 5 leggere min

Suono Progressi nel Few-Shot Learning per l'elaborazione audio

Questo pezzo parla del few-shot learning e del suo impatto sui task audio.

2025-06-28T12:04:10+00:00 ― 7 leggere min

Suono Trasformare la comunicazione: Conversione vocale basata sul viso

Una nuova tecnologia collega i tratti del viso alla voce, aiutando la comunicazione per chi non può parlare.

2025-06-28T06:24:05+00:00 ― 5 leggere min

Informatica - Suono