Questo studio mette in evidenza il ruolo dell'apprendimento auto-supervisionato nel rilevare emozioni dai dati audio.

2025-10-05T08:33:20+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Rendere la musica facile per tutti

Una nuova interfaccia semplifica la creazione musicale per i principianti usando la tecnologia da testo a audio.

2025-10-04T18:47:25+00:00 ― 5 leggere min

Suono Valutare gli apparecchi acustici e l'ottimizzazione vocale AI

La ricerca mette in evidenza i miglioramenti che l'AI può portare agli apparecchi acustici in ambienti rumorosi.

2025-10-04T17:58:50+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la separazione delle sorgenti musicali con dati rumorosi

Nuovo metodo migliora i dati etichettati male, potenziando la separazione delle sorgenti musicali.

2025-10-04T10:41:35+00:00 ― 6 leggere min

Suono Nuovi Metodi nella Decodifica dell'Attenzione Uditiva

Progressi nel decifrare come le persone si concentrano sui suoni usando l'attività cerebrale.

2025-10-04T07:43:21+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nelle tecniche di sintesi del campo sonoro

Un nuovo metodo migliora la chiarezza del suono e la localizzazione usando un approccio ibrido.

2025-10-04T07:27:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella cancellazione dell'eco acustico con CMNet

CMNet migliora la chiarezza della voce riducendo l'eco nei dispositivi di comunicazione.

2025-10-04T06:38:40+00:00 ― 5 leggere min

Suono Migliorare il riconoscimento degli obiettivi subacquei con le reti neurali

Un nuovo metodo migliora la classificazione dei suoni subacquei delle navi usando reti neurali.

2025-10-04T05:01:30+00:00 ― 5 leggere min

Suono Evoluzioni nella tecnologia degli apparecchi acustici

La ricerca punta a migliorare la chiarezza nelle protesi acustiche per una comunicazione migliore.

2025-10-04T02:35:45+00:00 ― 6 leggere min

Suono Progressi nel miglioramento del parlato con reti neurali a impulsi

Un nuovo metodo per migliorare la qualità del discorso usando reti a basso consumo energetico.

2025-10-03T21:44:15+00:00 ― 5 leggere min

Suono Comprendere i vocalizzi delle mucche durante lo stress

La ricerca mette in evidenza la comunicazione tra le mucche per migliorare le pratiche di allevamento caseario.

2025-10-03T15:15:35+00:00 ― 5 leggere min

Suono Presentiamo MuReNN: un nuovo modello per l'elaborazione audio

MuReNN combina modelli parametrici e non parametrico per un'analisi audio migliore.

2025-10-03T14:14:43+00:00 ― 5 leggere min

Apprendimento automatico BioLinguale: Una nuova era nella bioacustica

Rivoluzionare la ricerca sulla comunicazione animale con integrazione audio e linguistica innovativa.

2025-10-03T11:32:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sviluppi nel miglioramento del suono con PCNN

Presentiamo un nuovo modello per una comunicazione più chiara in ambienti rumorosi.

2025-10-03T07:58:20+00:00 ― 5 leggere min

Multimedia Progressi nel Matching Acustico Visivo

Un nuovo metodo migliora l'abbinamento audio usando immagini, rendendo più realistici gli ambienti sonori.

2025-10-03T03:55:25+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Progressi nelle Tecniche di Miglioramento del Parlato

Migliorare la qualità del parlato con metodi innovativi e set di dati multilingue.

2025-10-02T23:52:30+00:00 ― 6 leggere min

Suono Rilevamento Efficace dell'Audio Deepfake

Nuovi sistemi sono stati progettati per rilevare registrazioni audio false con una precisione migliorata.

2025-10-02T18:12:25+00:00 ― 6 leggere min

Suono Sviluppi nella diarizzazione degli speaker tramite integrazione audio-visiva

I nuovi sistemi migliorano l'identificazione degli altoparlanti usando sia dati audio che visivi.

2025-10-02T15:46:40+00:00 ― 5 leggere min

Suono MoisesDB: Una rivoluzione nella separazione delle sorgenti musicali

MoisesDB offre un dataset dettagliato per la separazione avanzata dei suoni musicali.

2025-10-02T09:18:00+00:00 ― 6 leggere min

Suono Avanzare con i sottotitoli musicali grazie ai grandi modelli linguistici

Usando LLM per creare un enorme dataset per la captioning musicale.

2025-10-02T08:29:25+00:00 ― 7 leggere min

Calcolo e linguaggio Sviluppi nella tecnologia per l'allenamento della pronuncia

I ricercatori stanno migliorando l'allenamento sulla pronuncia con nuove tecnologie per chi impara le lingue.

2025-10-02T07:40:50+00:00 ― 5 leggere min

Suono Progresso nella tecnologia di trasferimento dello stile vocale

HierVST trasforma le voci senza sforzo, migliorando la qualità audio senza bisogno di dati estesi.

2025-10-02T05:15:05+00:00 ― 5 leggere min

Multimedia Avanzamenti nella stima dell'engagement per le conversazioni

La ricerca sviluppa un modello per misurare con precisione l'engagement nelle conversazioni.

2025-10-01T21:57:50+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli DAVIS: Un Nuovo Approccio alla Separazione del Suono

DAVIS offre un modo nuovo per affrontare la separazione del suono audio e visivo.

2025-10-01T19:32:05+00:00 ― 5 leggere min

Suono Tecniche Avanzate di Segmentazione Audio-Visiva

Un nuovo metodo migliora l'identificazione precisa degli oggetti che producono suoni nei video.

2025-10-01T13:52:00+00:00 ― 7 leggere min

Suono Progressi nel Text-to-Speech con DiffProsody

DiffProsody migliora la velocità e la qualità della sintesi vocale grazie a una generazione di prosodia innovativa.

2025-10-01T13:03:25+00:00 ― 4 leggere min

Suono Affrontare la guerra della loudness con le reti De-limiter

Una nuova tecnologia punta a ripristinare la qualità della musica persa a causa della compressione del volume.

2025-10-01T02:31:50+00:00 ― 5 leggere min

Suono Sistema automatizzato per identificare l'afasia

Nuovo metodo promette di identificare più velocemente i disturbi del linguaggio come l'afasia.

2025-09-30T21:40:20+00:00 ― 5 leggere min

Crittografia e sicurezza Tecniche sonore inaudibili per la manipolazione del parlato

Un nuovo metodo utilizza suoni ultrasonici per confondere i sistemi di riconoscimento vocale senza essere rilevato.

2025-09-30T19:14:35+00:00 ― 6 leggere min

Calcolo e linguaggio Progressi nella tecnologia Text-to-Speech

Nuovi metodi migliorano la qualità della voce sintetizzata usando l'apprendimento auto-supervisionato.

2025-09-30T17:37:25+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale con il potenziamento delle parole chiave

Un nuovo metodo migliora la trascrizione di parole chiave rare nelle conversazioni aziendali.

2025-09-30T10:20:10+00:00 ― 6 leggere min

Suono Avanzare il riconoscimento vocale con l'apprendimento federato

L'apprendimento federato migliora il riconoscimento vocale mantenendo i dati dell'utente privati.

2025-09-30T08:43:00+00:00 ― 6 leggere min

Suono MusicLDM: Un Nuovo Approccio alla Generazione di Musica da Testo

MusicLDM trasforma il testo in musica originale, offrendo nuove strade per la creatività.

2025-09-30T05:28:40+00:00 ― 7 leggere min

Suono Migliorare le tecniche di estrazione della melodia cantata con il deep learning

Nuovi metodi migliorano l'accuratezza nell'estrazione delle melodie cantate da audio misti.

2025-09-30T01:25:45+00:00 ― 7 leggere min

Calcolo e linguaggio Sviluppi nella tecnologia dei sottotitoli audio

Nuovi metodi puntano a migliorare il captioning audio per una maggiore precisione ed efficienza.

2025-09-30T00:25:00+00:00 ― 5 leggere min

Suono Sviluppi nelle tecniche di miglioramento del suono

Nuovo modello migliora la chiarezza del parlato in ambienti rumorosi usando metodi innovativi.

2025-09-29T22:11:25+00:00 ― 5 leggere min

Suono Analizzando le canzoni popolari coreane attraverso la tecnologia

Uno studio sulle canzoni popolari coreane usando metodi analitici moderni.

2025-09-29T21:22:50+00:00 ― 8 leggere min

Grafica DiffDance: Una Nuova Era nella Generazione di Danza

DiffDance crea sequenze di danza dettagliate che si abbinano alla musica in modo efficace.

2025-09-29T16:31:20+00:00 ― 6 leggere min

Suono Affrontare il pregiudizio di genere nella trascrizione della voce cantata

Esaminare l'equità nella tecnologia di trascrizione della voce cantata tra i generi.

2025-09-29T15:42:45+00:00 ― 8 leggere min

Suono Avanzamenti nella personalizzazione delle parole chiave per i sistemi ASR

SeACo-Paraformer porta flessibilità e precisione alla tecnologia di riconoscimento vocale.

2025-09-29T14:05:35+00:00 ― 6 leggere min

Informatica - Suono