Ingegneria elettrica e scienze dei sistemi - Elaborazione dell'audio e del parlato

RSS

Elaborazione dell'audio e del parlato Bias nel Transfer Learning per il Riconoscimento Musicale

Questo studio esplora il pregiudizio nei modelli audio usati per il riconoscimento degli strumenti.

2025-10-06T09:39:25+00:00 ― 6 leggere min

Suono Progressi nella classificazione dei generi musicali con il deep learning

Questo studio esplora un approccio di deep learning per classificare con precisione i generi musicali.

2025-10-06T08:50:50+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Sviluppi nell'identificazione dei temi dai dati audio

La ricerca esplora metodi per identificare argomenti direttamente dalle registrazioni audio.

2025-10-05T23:56:25+00:00 ― 5 leggere min

Suono Localizzazione automatica delle sorgenti sonore in acque poco profonde

Nuovo metodo migliora il tracciamento della posizione delle sorgenti sonore in ambienti acquatici poco profondi.

2025-10-05T13:27:48+00:00 ― 7 leggere min

Suono Avanzando la tecnologia vocale con SCRAPS

Un nuovo modello collega fonetica e acustica per una tecnologia vocale migliore.

2025-10-05T13:24:50+00:00 ― 7 leggere min

Suono Avanzamenti nel riconoscimento delle emozioni con l'apprendimento auto-supervisionato

Questo studio mette in evidenza il ruolo dell'apprendimento auto-supervisionato nel rilevare emozioni dai dati audio.

2025-10-05T08:33:20+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Rendere la musica facile per tutti

Una nuova interfaccia semplifica la creazione musicale per i principianti usando la tecnologia da testo a audio.

2025-10-04T18:47:25+00:00 ― 5 leggere min

Suono Valutare gli apparecchi acustici e l'ottimizzazione vocale AI

La ricerca mette in evidenza i miglioramenti che l'AI può portare agli apparecchi acustici in ambienti rumorosi.

2025-10-04T17:58:50+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la separazione delle sorgenti musicali con dati rumorosi

Nuovo metodo migliora i dati etichettati male, potenziando la separazione delle sorgenti musicali.

2025-10-04T10:41:35+00:00 ― 6 leggere min

Suono Nuovi Metodi nella Decodifica dell'Attenzione Uditiva

Progressi nel decifrare come le persone si concentrano sui suoni usando l'attività cerebrale.

2025-10-04T07:43:21+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nelle tecniche di sintesi del campo sonoro

Un nuovo metodo migliora la chiarezza del suono e la localizzazione usando un approccio ibrido.

2025-10-04T07:27:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella cancellazione dell'eco acustico con CMNet

CMNet migliora la chiarezza della voce riducendo l'eco nei dispositivi di comunicazione.

2025-10-04T06:38:40+00:00 ― 5 leggere min

Suono Migliorare il riconoscimento degli obiettivi subacquei con le reti neurali

Un nuovo metodo migliora la classificazione dei suoni subacquei delle navi usando reti neurali.

2025-10-04T05:01:30+00:00 ― 5 leggere min

Suono Evoluzioni nella tecnologia degli apparecchi acustici

La ricerca punta a migliorare la chiarezza nelle protesi acustiche per una comunicazione migliore.

2025-10-04T02:35:45+00:00 ― 6 leggere min

Suono Progressi nel miglioramento del parlato con reti neurali a impulsi

Un nuovo metodo per migliorare la qualità del discorso usando reti a basso consumo energetico.

2025-10-03T21:44:15+00:00 ― 5 leggere min

Suono Comprendere i vocalizzi delle mucche durante lo stress

La ricerca mette in evidenza la comunicazione tra le mucche per migliorare le pratiche di allevamento caseario.

2025-10-03T15:15:35+00:00 ― 5 leggere min

Suono Presentiamo MuReNN: un nuovo modello per l'elaborazione audio

MuReNN combina modelli parametrici e non parametrico per un'analisi audio migliore.

2025-10-03T14:14:43+00:00 ― 5 leggere min

Apprendimento automatico BioLinguale: Una nuova era nella bioacustica

Rivoluzionare la ricerca sulla comunicazione animale con integrazione audio e linguistica innovativa.

2025-10-03T11:32:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella rilevazione attiva degli speaker usando l'audio

La ricerca dimostra i vantaggi di avere più microfoni per rilevare e localizzare gli oratori.

2025-10-03T11:12:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel miglioramento del suono con PCNN

Presentiamo un nuovo modello per una comunicazione più chiara in ambienti rumorosi.

2025-10-03T07:58:20+00:00 ― 5 leggere min

Multimedia Progressi nel Matching Acustico Visivo

Un nuovo metodo migliora l'abbinamento audio usando immagini, rendendo più realistici gli ambienti sonori.

2025-10-03T03:55:25+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Nuovo Dataset Collega Emozioni alla Musica MIDI

Un dataset collega le emozioni alle canzoni MIDI tramite l'analisi del testo delle canzoni.

2025-10-03T02:18:15+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Progressi nelle Tecniche di Miglioramento del Parlato

Migliorare la qualità del parlato con metodi innovativi e set di dati multilingue.

2025-10-02T23:52:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Affrontare la perdita di qualità audio durante la trasmissione

Nuove tecniche mirano a migliorare la qualità audio affrontando la perdita di pacchetti.

2025-10-02T22:15:20+00:00 ― 5 leggere min

Suono Rilevamento Efficace dell'Audio Deepfake

Nuovi sistemi sono stati progettati per rilevare registrazioni audio false con una precisione migliorata.

2025-10-02T18:12:25+00:00 ― 6 leggere min

Suono Sviluppi nella diarizzazione degli speaker tramite integrazione audio-visiva

I nuovi sistemi migliorano l'identificazione degli altoparlanti usando sia dati audio che visivi.

2025-10-02T15:46:40+00:00 ― 5 leggere min

Suono MoisesDB: Una rivoluzione nella separazione delle sorgenti musicali

MoisesDB offre un dataset dettagliato per la separazione avanzata dei suoni musicali.

2025-10-02T09:18:00+00:00 ― 6 leggere min

Suono Avanzare con i sottotitoli musicali grazie ai grandi modelli linguistici

Usando LLM per creare un enorme dataset per la captioning musicale.

2025-10-02T08:29:25+00:00 ― 7 leggere min

Calcolo e linguaggio Sviluppi nella tecnologia per l'allenamento della pronuncia

I ricercatori stanno migliorando l'allenamento sulla pronuncia con nuove tecnologie per chi impara le lingue.

2025-10-02T07:40:50+00:00 ― 5 leggere min

Suono Progresso nella tecnologia di trasferimento dello stile vocale

HierVST trasforma le voci senza sforzo, migliorando la qualità audio senza bisogno di dati estesi.

2025-10-02T05:15:05+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Nuovo modello rivoluziona l'analisi della struttura musicale

Un approccio unificato migliora l'analisi musicale integrando diversi elementi strutturali.

2025-10-01T23:35:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la classificazione del linguaggio per bambini con autismo

La ricerca si concentra sulla classificazione del linguaggio tra bambini e adulti usando dati non etichettati.

2025-10-01T22:46:25+00:00 ― 6 leggere min

Multimedia Avanzamenti nella stima dell'engagement per le conversazioni

La ricerca sviluppa un modello per misurare con precisione l'engagement nelle conversazioni.

2025-10-01T21:57:50+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli DAVIS: Un Nuovo Approccio alla Separazione del Suono

DAVIS offre un modo nuovo per affrontare la separazione del suono audio e visivo.

2025-10-01T19:32:05+00:00 ― 5 leggere min

Suono Tecniche Avanzate di Segmentazione Audio-Visiva

Un nuovo metodo migliora l'identificazione precisa degli oggetti che producono suoni nei video.

2025-10-01T13:52:00+00:00 ― 7 leggere min

Suono Progressi nel Text-to-Speech con DiffProsody

DiffProsody migliora la velocità e la qualità della sintesi vocale grazie a una generazione di prosodia innovativa.

2025-10-01T13:03:25+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Progressi nella Ricostruzione del Campo Sonoro con GAN

I modelli di deep learning migliorano la ricostruzione del campo sonoro in ambienti complessi.

2025-10-01T04:57:35+00:00 ― 7 leggere min

Suono Affrontare la guerra della loudness con le reti De-limiter

Una nuova tecnologia punta a ripristinare la qualità della musica persa a causa della compressione del volume.

2025-10-01T02:31:50+00:00 ― 5 leggere min

Suono Sistema automatizzato per identificare l'afasia

Nuovo metodo promette di identificare più velocemente i disturbi del linguaggio come l'afasia.

2025-09-30T21:40:20+00:00 ― 5 leggere min

Crittografia e sicurezza Tecniche sonore inaudibili per la manipolazione del parlato

Un nuovo metodo utilizza suoni ultrasonici per confondere i sistemi di riconoscimento vocale senza essere rilevato.

2025-09-30T19:14:35+00:00 ― 6 leggere min