Informatica - Suono

RSS

Suono ElasticAST: Un Approccio Flessibile alla Classificazione Audio

ElasticAST consente di elaborare audio a lunghezza variabile in modo efficiente senza perdere dettagli importanti.

2025-07-18T02:31:05+00:00 ― 5 leggere min

Suono Clonare Voci: Una Nuova Sfida per i Diritti Musicali

Analizzando i metodi per identificare i cantanti tra le crescenti preoccupazioni per il voice cloning.

2025-07-18T01:42:30+00:00 ― 6 leggere min

Suono Nuovo metodo per rilevare audio parzialmente falso

Un nuovo metodo migliora il rilevamento di clip audio miste tra reali e falsi.

2025-07-17T17:36:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Valutare l'efficienza di Mamba nella tecnologia del parlato

Mamba promette bene contro i transformers nei compiti di linguaggio, specialmente per input lunghi.

2025-07-17T13:33:45+00:00 ― 5 leggere min

Suono Progressi nella Sintesi della Voce Cantata con SingFlex

SingFlex offre soluzioni innovative per creare diverse voci cantanti in modo efficiente.

2025-07-17T07:05:05+00:00 ― 5 leggere min

Teoria dell'informazione Misurare la complessità nella musica da danza irlandese

Uno studio sulla complessità dei brani di danza tradizionale irlandese usando metodi di compressione.

2025-07-17T06:56:50+00:00 ― 5 leggere min

Suono RefinPaint: Un Nuovo Approccio alla Generazione Musicale

RefinPaint migliora la creazione musicale identificando e rafforzando le aree deboli in modo efficace.

2025-07-17T06:16:30+00:00 ― 6 leggere min

Suono Adattare Whisper per un miglioramento della verifica dell'identità del parlante

Un nuovo framework migliora le prestazioni della verifica dell'identità con dati limitati.

2025-07-17T00:36:25+00:00 ― 6 leggere min

Suono Colmare il divario: AI e musicisti in armonia

Esplorare nuovi modi in cui l'IA può collaborare con i musicisti attraverso l'interpretazione.

2025-07-16T15:42:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzare nella Sicurezza Audio con l'Apprendimento Continuo

CADE migliora il rilevamento audio contro le minacce di spoofing in evoluzione usando tecniche di apprendimento continuo.

2025-07-16T10:50:30+00:00 ― 7 leggere min

Robotica Utilizzare il suono per la localizzazione degli oggetti nella robotica

Un nuovo metodo aiuta i robot a trovare oggetti caduti usando il suono.

2025-07-16T06:47:35+00:00 ― 6 leggere min

Suono Sviluppi nei sistemi di droni controllati a voce

I nuovi sistemi di comando vocale migliorano il controllo dei droni senza bisogno di mani.

2025-07-16T05:42:18+00:00 ― 6 leggere min

Suono Evoluzioni nel modeling degli amplificatori per chitarra

Nuove tecniche permettono una migliore emulazione degli amplificatori e degli effetti per chitarra.

2025-07-15T23:30:20+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare l'ASR con il Code-Switching tramite Distillazione della Conoscenza

Un nuovo framework migliora le prestazioni dell'ASR usando dati e risorse limitati.

2025-07-15T22:41:45+00:00 ― 5 leggere min

Suono Avanzare nella Sintesi Audio con Modelli di Diffusione

Un nuovo metodo migliora l'efficienza nella generazione audio usando tecniche di attenzione innovative.

2025-07-15T20:16:00+00:00 ― 5 leggere min

Suono BandControlNet: Un Nuovo Approccio alla Creazione Musicale

Scopri come l'IA sta trasformando la generazione musicale con BandControlNet.

2025-07-15T19:27:25+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Nuovo metodo per rilevare i deepfake

Un nuovo approccio migliora il rilevamento dei deepfake usando analisi audio-visiva.

2025-07-15T12:10:10+00:00 ― 6 leggere min

Suono L'evoluzione dei sistemi di riconoscimento vocale automatico

Uno sguardo ai progressi nelle tecnologie e nei metodi di riconoscimento vocale.

2025-07-15T11:21:35+00:00 ― 5 leggere min

Suono Migliorare il riconoscimento della balbuzie con MMSD-Net

Un nuovo metodo migliora il rilevamento della balbuzie combinando dati audio, video e testo.

2025-07-15T07:18:40+00:00 ― 6 leggere min

Suono Generazione di Suono Innovativa per Modelli Umani 3D

Un nuovo metodo migliora la creazione del suono per modelli umani 3D realistici.

2025-07-15T00:01:25+00:00 ― 7 leggere min

Suono Stima dei tassi di respirazione attraverso l'analisi del parlato

Questo studio mostra come il parlato possa stimare i tassi di respirazione usando modelli avanzati.

2025-07-14T23:12:50+00:00 ― 6 leggere min

Suono GraphMuse: Un Nuovo Strumento per l'Analisi Musicale

GraphMuse semplifica l'analisi dei dati musicali simbolici con tecniche avanzate di machine learning.

2025-07-14T19:58:30+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale per la lingua polacca

La ricerca presenta nuovi metodi per valutare i sistemi di riconoscimento vocale in polacco.

2025-07-14T16:44:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato MSceneSpeech: Avanzando nella Sintesi Vocale Mandarino

Un nuovo set di dati migliora il parlato delle macchine per il mandarino, puntando a un'espressione naturale.

2025-07-14T09:26:55+00:00 ― 6 leggere min

Multimedia Avanzare nella localizzazione delle fonti sonore attraverso l'integrazione audio-visiva

Uno studio su come migliorare la localizzazione delle sorgenti sonore sfruttando meglio le informazioni audio e visive.

2025-07-14T06:12:35+00:00 ― 8 leggere min

Apprendimento automatico Valutare la salute cognitiva attraverso l'analisi del linguaggio

Un nuovo framework analizza il discorso per identificare lievi problemi cognitivi in diverse lingue.

2025-07-14T05:24:00+00:00 ― 5 leggere min

Suono L'AI e la sfida dei generi musicali diversi

Esplorare l'impatto dell'IA sugli stili musicali sottorappresentati.

2025-07-14T02:58:15+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il Text-to-Speech per le lingue indiane

Un metodo per migliorare i sistemi TTS per una pronuncia migliore delle parole OOV in India.

2025-07-14T02:09:40+00:00 ― 5 leggere min

Suono Innovazioni nella tecnologia degli apparecchi acustici grazie al machine learning

Nuovi modelli di apprendimento automatico migliorano la chiarezza del parlato per gli utenti di apparecchi acustici.

2025-07-13T23:43:55+00:00 ― 6 leggere min

Suono Studiare le interazioni sociali con audio a bassa frequenza

La ricerca esplora l'audio a bassa frequenza per proteggere la privacy negli studi sul comportamento sociale.

2025-07-13T21:18:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Capire la propagazione del suono negli spazi connessi

Esplorando come il suono si comporta in ambienti con più stanze e le sue implicazioni nella tecnologia.

2025-07-13T20:29:35+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Gli strumenti di intelligenza artificiale trasformano il processo di editing musicale

Nuovi strumenti AI stanno semplificando il montaggio musicale con tecniche innovative e maggiore precisione.

2025-07-13T18:52:25+00:00 ― 5 leggere min

Calcolo e linguaggio Un Nuovo Approccio alla Traduzione Vocale: Abbinamento di Voce Preimpostata

Il matching vocale preset migliora la traduzione del parlato, garantendo privacy e riducendo i rischi.

2025-07-13T18:03:50+00:00 ― 6 leggere min

Suono Assistente del Compositore 2: Un Nuovo Strumento per i Musicisti

Un nuovo sistema aiuta i musicisti a creare musica con maggiore controllo e precisione.

2025-07-13T14:00:55+00:00 ― 7 leggere min

Suono Valutare l'impatto dell'IA sull'originalità della musica

Un nuovo strumento per valutare la replicazione nella musica creata dall'IA.

2025-07-13T12:23:45+00:00 ― 7 leggere min

Suono Generazione Audio Aperta: Un Nuovo Modello

Un nuovo modello di testo-audio che usa solo dati pubblici.

2025-07-13T11:35:10+00:00 ― 5 leggere min

Calcolo e linguaggio Rasa: Una Rivelazione nella Sintesi Vocale delle Lingue Indiane

Il dataset Rasa fa progressi nel text-to-speech per le lingue indiane, con voce neutra ed espressiva.

2025-07-13T05:55:05+00:00 ― 6 leggere min

Suono Sviluppi nella tecnologia di riconoscimento delle emozioni nella voce

Nuovi metodi migliorano la comprensione delle emozioni umane nel linguaggio da parte delle macchine.

2025-07-12T18:34:55+00:00 ― 4 leggere min

Suono Rendere gli strumenti di intelligenza artificiale accessibili agli artisti

Semplificare gli strumenti di intelligenza artificiale può dare una spinta agli artisti per migliorare la loro espressione creativa.

2025-07-12T17:46:20+00:00 ― 5 leggere min

Suono MusiConGen: Avanzando la tecnologia da testo a musica

MusiConGen migliora il controllo degli utenti nella generazione di musica da testo.

2025-07-12T16:57:45+00:00 ― 6 leggere min