Articoli più recenti per Audio

Suono Bilanciare la privacy e il monitoraggio audio intelligente

Nuovi metodi mirano a proteggere la privacy del parlato nei sistemi di monitoraggio audio.

2025-09-28T06:30:50+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Rilevare i Deepfake: Un Nuovo Approccio

Un metodo che usa audio e video per migliorare la rilevazione dei deepfake.

2025-09-27T19:29:12+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Progressi nella previsione della qualità audio con GML

Un nuovo modello di intelligenza artificiale migliora la previsione dei punteggi di qualità audio.

2025-09-24T03:43:40+00:00 ― 6 leggere min

Suono Generare suoni realistici da video silenziosi

La ricerca esplora il deep learning per creare audio che si abbini al contenuto video muto.

2025-09-22T04:45:50+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Combinare Suoni e Immagini per Migliorare la Qualità Audio

Un nuovo metodo migliora le registrazioni audio usando indizi visivi.

2025-09-22T03:57:15+00:00 ― 6 leggere min

Interazione uomo-macchina Il Ruolo dell'AI nel Racconto Digitale

Esplorare l'impatto dei contenuti generati dall'IA sull'arte del raccontare storie.

2025-09-22T02:56:54+00:00 ― 7 leggere min

Suono Migliorare la qualità della musica per registrazioni quotidiane

Un nuovo sistema migliora le registrazioni audio per esperienze di ascolto migliori.

2025-09-21T15:48:30+00:00 ― 6 leggere min

Recupero delle informazioni Sfide nell'Imparare dai Video Musicali

Questo studio esamina le difficoltà nell'usare l'apprendimento contrastivo per comprendere i video musicali.

2025-09-18T17:21:45+00:00 ― 6 leggere min

Suono Nuovo modello migliora la valutazione dell'intensità di alimentazione dei pesci

Un approccio unificato per valutare l'alimentazione dei pesci usando dati audio e video.

2025-09-14T21:03:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la Diarizzazione dei Parlanti con Modelli Linguistici

Questo articolo esplora i progressi nella diarizzazione degli speaker utilizzando modelli di linguaggio per una maggiore precisione.

2025-09-14T03:14:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Il ruolo dell'audio nella rilevazione dei pedoni

I ricercatori stanno esplorando la tecnologia di rilevamento audio per migliorare il riconoscimento dei pedoni nelle aree urbane.

2025-09-14T00:48:40+00:00 ― 6 leggere min

Suono Nuovi metodi per rilevare audio generato da IA

Tecniche avanzate per garantire l'autenticità audio nell'era del cloning vocale.

2025-09-13T03:40:24+00:00 ― 5 leggere min

Suono Migliorare la generazione audio attraverso tecniche di allineamento del testo

Un nuovo approccio migliora la generazione audio allineando l'audio con le descrizioni testuali.

2025-09-11T07:13:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare le tecniche di rilevamento del discorso falso

Nuovi metodi stanno migliorando la nostra capacità di rilevare il discorso falso in modo efficace.

2025-09-11T02:21:55+00:00 ― 6 leggere min

Suono Migliorare l'addestramento del vocoder con l'apprendimento contrastivo

Nuovi metodi migliorano le prestazioni del vocoder con dati audio limitati.

2025-09-10T12:36:00+00:00 ― 5 leggere min

Crittografia e sicurezza Migliorare il rilevamento dei deepfake attraverso metodi di allenamento diversi

Questo studio esplora strategie di allenamento per migliorare la rilevazione di audio falsi.

2025-09-09T22:01:30+00:00 ― 5 leggere min

Suono Un Nuovo Metodo per Rilevare il Voice Spoofing

Un metodo solido per identificare anomalie audio e combattere il voice spoofing.

2025-09-09T07:27:00+00:00 ― 5 leggere min

Calcolo e linguaggio Sviluppi nell'identificazione del linguaggio parlato

Nuovi metodi combinano audio e metadati per un riconoscimento linguistico migliore.

2025-09-08T07:09:30+00:00 ― 5 leggere min

Suono Avanzamenti nella Sintesi Musicale Multi-Strumento

Un nuovo metodo migliora la generazione musicale aggiungendo il contesto della performance.

2025-09-07T01:11:55+00:00 ― 6 leggere min

Suono Avanzare nel recupero musicale con l'apprendimento auto-supervisionato

Un nuovo approccio sfrutta l'apprendimento auto-supervisionato per collegare audio e spartiti.

2025-09-06T21:09:00+00:00 ― 5 leggere min

Suono Collegare Audio e Partitura con Reti Ricorrenti

Un nuovo metodo migliora il matching tra audio e spartiti.

2025-09-06T19:31:50+00:00 ― 6 leggere min

Suono Nuova tecnica di watermarks per modelli audio

Un nuovo metodo per aggiungere filigrane all'audio creato da modelli di diffusione per proteggere la proprietà.

2025-09-06T04:08:45+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli AVI-Talking: Un Nuovo Modo di Creare Faccioni Animati Espressivi

AVI-Talking crea facce 3D realistiche che esprimono emozioni attraverso l'audio.

2025-09-04T10:11:30+00:00 ― 6 leggere min

Elaborazione del segnale Un Nuovo Approccio per Identificare i Sintomi della Schizofrenia

Combinare audio, video e testo per valutazioni della salute mentale migliori.

2025-09-03T22:42:15+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Progressi nella generazione di video con facce che parlano

Nuovi metodi migliorano il realismo nei umani digitali e avatar.

2025-09-03T03:38:42+00:00 ― 4 leggere min

Suono Combinare Voce e Viso per una Migliore Identificazione

Nuovo metodo migliora la verifica dell'identità degli speaker unendo dati audio e visivi.

2025-09-02T07:50:15+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Rilevare l'umorismo nei video con FunnyNet-W

Un nuovo modello identifica i momenti divertenti nei video usando dati visivi, audio e di testo.

2025-08-30T23:09:25+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella Elaborazione Multimodale con CoAVT

CoAVT integra dati audio, visivi e testuali per una comprensione migliore.

2025-08-28T12:02:50+00:00 ― 8 leggere min

Suono Audio Flamingo: Un Nuovo Modello per Comprendere il Suono

Audio Flamingo è super nel ascoltare, chiacchierare e adattarsi a nuove task audio.

2025-08-26T16:19:20+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Avanzare la comunicazione umana attraverso la modellazione del movimento

Un nuovo modello genera movimenti realistici nelle conversazioni, migliorando la comprensione dell'interazione.

2025-08-24T15:59:36+00:00 ― 5 leggere min

Calcolo e linguaggio Rilevazione in tempo reale dei problemi nelle conversazioni AI

Un nuovo modello migliora il rilevamento delle interruzioni del dialogo per i sistemi di intelligenza artificiale.

2025-08-20T13:38:18+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli SonicDiffusion: Unire Suono e Creazione di Immagini

Un nuovo metodo per creare e modificare immagini usando segnali audio.

2025-08-14T22:56:36+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato CLaM-TTS: Avanzamento della Tecnologia Text-to-Speech

CLaM-TTS migliora la sintesi vocale usando tecniche avanzate per una resa migliore e più efficiente.

2025-08-13T08:28:55+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Avanzamenti nella generazione di gesti con CoCoGesture

CoCoGesture crea gesti realistici che si abbinano alle parole pronunciate, migliorando l'interazione.

2025-08-06T05:04:00+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzamenti nella traduzione dei segnali MEG in testo

Un nuovo framework trasforma i segnali MEG in testo significativo, aiutando la tecnologia di comunicazione.

2025-08-03T03:43:42+00:00 ― 10 leggere min

Suono Trasformare la didascalia audio tramite metodi innovativi

Un nuovo approccio alla captioning audio riduce la dipendenza dai dati abbinati.

2025-07-30T21:24:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Utilizzare la tecnologia audio per il tracciamento dei pedoni

Questo studio esamina i metodi audio per tracciare i movimenti dei pedoni nelle aree urbane.

2025-07-29T17:52:20+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato AV-CrossNet: Migliorare il riconoscimento vocale nel rumore

Un nuovo sistema aiuta a separare il parlato dal rumore per una comunicazione più chiara.

2025-07-29T03:17:50+00:00 ― 7 leggere min

Robotica Imparare con il Suono: Una Nuova Era per i Robot

Un nuovo sistema aiuta i robot ad apprendere compiti utilizzando audio da dimostrazioni reali.

2025-07-26T09:42:35+00:00 ― 7 leggere min

Apprendimento automatico Combinare testo e audio per una migliore classificazione delle emozioni

Uno studio sull'uso di dati testuali e audio per migliorare il riconoscimento delle emozioni.

2025-07-22T23:55:06+00:00 ― 6 leggere min