Ingegneria elettrica e scienze dei sistemi - Elaborazione dell'audio e del parlato

RSS

Suono Classificare i canti degli uccelli africani tramite analisi audio

Uno studio su come usare registrazioni sonore per identificare diverse specie di uccelli in Africa.

2025-10-15T09:02:35+00:00 ― 6 leggere min

Informatica neurale ed evolutiva Avanzare le Reti Neurali a Spike Tramite Apprendimento dei Ritardi

Un nuovo metodo migliora l'apprendimento nei Reti Neurali Spiking incorporando aggiustamenti dei ritardi.

2025-10-15T07:25:25+00:00 ― 6 leggere min

Recupero delle informazioni Come le raccomandazioni musicali usano l'analisi dei dati

Scopri come i sistemi di raccomandazione suggeriscono canzoni in base alle preferenze degli utenti.

2025-10-15T02:33:55+00:00 ― 5 leggere min

Apprendimento automatico Affrontare il problema dell'imparità nei dataset per la classificazione audio

Questo articolo parla delle sfide e delle tecniche per gestire il disequilibrio dei dataset nella classificazione audio.

2025-10-15T00:08:10+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzando il riconoscimento vocale per le lingue a bassa risorsa

Un nuovo approccio migliora il riconoscimento vocale per il romeno usando l'inibizione laterale.

2025-10-14T23:19:35+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzare nella privacy di genere nell'audio: nuove intuizioni

La ricerca evidenzia metodi per proteggere la privacy di genere nell'audio parlato.

2025-10-14T21:42:25+00:00 ― 6 leggere min

Suono Comprendere le emozioni nel riconoscimento vocale

Uno sguardo su come catturare le emozioni dietro le parole dette in modo più accurato.

2025-10-14T16:02:20+00:00 ― 5 leggere min

Suono Avanzare nella classificazione musicale con audio embedding

Usare embeddings audio pre-addestrati porta a modelli di classificazione musicale migliori.

2025-10-14T13:36:35+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Nuovo modello migliora la comprensione del processamento del linguaggio nel cervello

La ricerca mette in evidenza il ruolo dei confini delle parole nel linguaggio e nell'attività EEG.

2025-10-14T11:59:25+00:00 ― 6 leggere min

Suono Progressi nella tecnologia di sintesi labiale in linguaggio parlato

Nuovo framework migliora la chiarezza del parlato da video silenziosi grazie a un'elaborazione migliorata.

2025-10-13T19:47:45+00:00 ― 6 leggere min

Suono La scienza dietro il mridangam: uno strumento unico

Scopri il mix tra arte e scienza nello studio del mridangam.

2025-10-13T17:19:15+00:00 ― 7 leggere min

Calcolo e linguaggio Avanzare nel riconoscimento vocale per lingue a basso ресурсo

Un nuovo metodo migliora il riconoscimento delle parole personalizzate nei sistemi ASR per lingue con dati limitati.

2025-10-13T13:19:05+00:00 ― 5 leggere min

Suono Progressi nella Rilevazione di Audio Falso Usando Modelli Conformer

I ricercatori sviluppano un modello Conformer per migliorare il rilevamento dell'audio falso.

2025-10-13T03:36:05+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Proteggere la privacy di genere nei sistemi di riconoscimento vocale

Un metodo per nascondere le informazioni di genere pur garantendo la verifica dell'identità nel riconoscimento vocale.

2025-10-12T22:44:35+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzando nella rilevazione dell'Alzheimer attraverso l'analisi del parlato

Nuovi metodi migliorano la diagnosi precoce dell'Alzheimer usando analisi del parlato e dell'audio.

2025-10-12T19:30:15+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Nuova banca dati svela intuizioni sui suoni degli strumenti musicali

Esplora dati sonori di 41 strumenti musicali con registrazioni dettagliate.

2025-10-12T15:27:20+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzare gli Acoustic Word Embeddings per il linguaggio parlato

Ricerca su come migliorare i word embeddings acustici con comprensione semantica e dati multilingue.

2025-10-12T14:38:45+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nel Riconoscimento Vocale per la Disartria

Le nuove tecnologie migliorano la comunicazione per chi ha disturbi del linguaggio.

2025-10-12T13:01:35+00:00 ― 6 leggere min

Calcolo e linguaggio Innovazioni nella tecnologia di elaborazione del parlato in tempo reale

Un nuovo sistema combina trascrizione e traduzione per una comunicazione migliore.

2025-10-12T11:24:25+00:00 ― 5 leggere min

Suono Avanzamenti nel riconoscimento vocale con Whisper-AT

Whisper-AT combina il riconoscimento vocale e il tagging audio per migliorare le prestazioni.

2025-10-12T08:10:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Integrare il parlato con i modelli linguistici: il metodo Speech-LLaMA

Un nuovo approccio che combina il parlato con i modelli linguistici per una traduzione migliorata.

2025-10-11T18:24:10+00:00 ― 5 leggere min

Suono Progressi nella trascrizione automatica del pianoforte

Nuovo metodo migliora la precisione nel trasformare l'audio del pianoforte in partiture.

2025-10-11T14:21:15+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Il panorama in evoluzione dell'AI audio generativa

Questo articolo parla delle esigenze e delle sfide nella tecnologia audio generativa.

2025-10-11T13:32:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la rilevazione della tubercolosi attraverso l'analisi della tosse

Nuovi metodi usano i suoni della tosse e i dati sulla salute per rilevare meglio la tubercolosi.

2025-10-11T09:29:45+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Cambiamenti nella voce nei pazienti con cancro orale durante il trattamento

Questo studio esplora come le caratteristiche vocali si evolvono nei pazienti con cancro orale dopo il trattamento.

2025-10-11T08:41:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzando il Timbro con DiffTransfer

Un nuovo metodo per cambiare il timbro musicale usando tecniche avanzate di machine learning.

2025-10-11T07:52:35+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale con i RNN-Transducers

Nuovi metodi migliorano l'accuratezza del riconoscimento vocale, risolvendo errori di trascrizione comuni.

2025-10-11T04:38:15+00:00 ― 4 leggere min

Suono Sviluppi nella sintesi vocale articolatoria

Uno studio su come migliorare la riproduzione del suono vocale attraverso tecniche di sintesi avanzate.

2025-10-11T02:12:30+00:00 ― 6 leggere min

Suono Presentiamo VampNet: Un Nuovo Modo di Creare Musica

VampNet trasforma la lavorazione della musica grazie a tecniche innovative di modeling dei token.

2025-10-11T01:23:55+00:00 ― 4 leggere min

Suono EchoVest: Una Nuova Speranza per chi ha Problemi di Udito

Tecnologia indossabile conveniente per persone con perdita uditiva.

2025-10-10T23:46:45+00:00 ― 5 leggere min

Suono Avanzare nell'allineamento dei testi nelle piattaforme musicali

Un nuovo modello migliora la precisione dei tempi per i testi nelle app musicali.

2025-10-10T18:55:15+00:00 ― 6 leggere min

Interazione uomo-macchina Presentiamo SnakeSynth: Un Nuovo Modo di Creare Suoni

Un sintetizzatore web che consente agli utenti di creare musica usando gesti semplici.

2025-10-10T16:29:30+00:00 ― 5 leggere min

Suono AI e Creatività nella Musica Metal Progressivo

Uno studio sul ruolo dell'IA nella generazione di musica metal progressivo.

2025-10-10T13:15:10+00:00 ― 6 leggere min

Suono ShredGP: Un Nuovo Modo per Generare Musica con la Chitarra

Un modello che crea tablature per chitarra che riflettono gli stili dei famosi chitarristi.

2025-10-10T12:26:35+00:00 ― 6 leggere min

Suono Progressi nell'Apprendimento Auto-Supervisionato per l'Analisi Musicale

Esplorare il potenziale dell'apprendimento auto-supervisionato nel recupero di informazioni musicali.

2025-10-10T10:00:50+00:00 ― 6 leggere min

Suono Analisi audio nella rilevazione del COVID-19

Usare segnali audio per identificare i rischi per la salute respiratoria.

2025-10-10T09:12:15+00:00 ― 8 leggere min

Calcolo e linguaggio SummaryMixing: Un Nuovo Approccio al Riconoscimento Vocale

Un nuovo metodo migliora la velocità e l'accuratezza del riconoscimento vocale riducendo l'uso delle risorse.

2025-10-10T07:35:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella Bioacustica attraverso Feature Embeddings

Questo studio migliora il monitoraggio della fauna selvatica usando le caratteristiche audio per una migliore classificazione dei suoni.

2025-10-10T02:43:35+00:00 ― 9 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella conversione vocale con la tecnologia Urhythmic

Urhythmic migliora la conversione vocale concentrandosi sul ritmo del parlato.

2025-10-09T21:52:05+00:00 ― 5 leggere min

Suono Avanzamenti nel Recupero di Informazioni Musicali in Tempo Reale per Guitaristi

La ricerca migliora le tecniche di fingerstyle percussivo per chitarristi usando il recupero del suono in tempo reale.

2025-10-09T15:23:25+00:00 ― 8 leggere min