Ingegneria elettrica e scienze dei sistemi - Elaborazione dell'audio e del parlato

RSS

Suono Avanzamenti nella Rilevazione di Eventi Sonori Usando il Few-Shot Learning

Questo articolo parla di come migliorare il rilevamento delle sequenze sonore nel riconoscimento audio.

2025-11-13T20:44:25+00:00 ― 6 leggere min

Calcolo e linguaggio Impatto della Qualità Audio sull'Apprendimento delle Lingue Ricerca

Uno studio rivela come la chiarezza audio influisce sull'analisi dell'acquisizione linguistica nei neonati.

2025-11-13T14:15:45+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Nuovo Strumento di Simulazione Acustica per Posizionamento Indoor

Uno strumento migliora i sistemi di posizionamento interni basati sul suono tramite simulazioni efficienti.

2025-11-13T10:12:50+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzamenti nei sistemi di comprensione del linguaggio parlato

Un nuovo approccio migliora la comprensione del linguaggio parlato usando un'elaborazione audio efficiente.

2025-11-13T02:07:00+00:00 ― 6 leggere min

Suono Migliorare l'efficienza delle CNN tramite potatura dei filtri

Questo documento presenta un metodo per migliorare le CNN rimuovendo filtri inutili.

2025-11-12T15:35:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Bilanciare Velocità e Accuratezza nel Riconoscimento Vocale

Un nuovo approccio migliora il riconoscimento vocale in tempo reale bilanciando velocità e precisione.

2025-11-12T13:09:40+00:00 ― 7 leggere min

Calcolo e linguaggio Presentiamo X-LLM: Un Nuovo Modello Linguistico Multimodale

X-LLM integra immagini, video e discorsi nel trattamento del linguaggio.

2025-11-12T11:32:30+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzamenti nel riconoscimento delle emozioni nella voce

Un nuovo metodo migliora il rilevamento delle emozioni nel parlato usando tecniche di self-attention.

2025-11-12T06:41:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Fast Conformer: Avanzando nel Riconoscimento Vocale

Fast Conformer migliora la velocità e l'accuratezza del riconoscimento vocale per diverse applicazioni.

2025-11-11T20:09:25+00:00 ― 5 leggere min

Calcolo e linguaggio Collegare l'elaborazione del parlato e l'elaborazione del linguaggio naturale

Unire linguaggio parlato e scritto per modelli di comunicazione migliori.

2025-11-11T16:06:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nella tecnologia da parlato a canto

La ricerca presenta un metodo per convertire parole parlate in canto in modo efficiente.

2025-11-11T12:52:10+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Tecnologia del linguaggio e rischi per la privacy

Esaminando l'impatto della tecnologia vocale sulla privacy personale.

2025-11-11T11:15:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato QVoice: Il tuo partner nella pronuncia araba

Un'app mobile pensata per migliorare la pronuncia araba per tutti gli studenti.

2025-11-11T08:49:15+00:00 ― 5 leggere min

Suono Riparare le lacune nell'audio del parlato con l'apprendimento automatico

Questo articolo parla di come il machine learning colma le lacune nell'audio vocale.

2025-11-11T07:12:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Nuovo metodo per la localizzazione delle sorgenti sonore usando tre microfoni

Questo metodo aiuta le persone con problemi uditivi a individuare le fonti sonore nel loro ambiente.

2025-11-11T05:34:55+00:00 ― 6 leggere min

Suono Avanzamenti nella tecnologia di miglioramento del suono

Esplora le ultime tecniche per migliorare la chiarezza del parlato in ambienti rumorosi.

2025-11-11T04:46:20+00:00 ― 6 leggere min

Suono Avanzamenti nella separazione audio con AudioSlots

AudioSlots migliora la chiarezza del suono separando efficacemente le registrazioni audio miste.

2025-11-11T03:57:45+00:00 ― 5 leggere min

Suono Creare Cantanti Digitali: Un Nuovo Approccio

Un metodo per creare voci cantanti senza etichettatura vocale dettagliata.

2025-11-11T00:43:25+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare il Riconoscimento Vocale per Parole Rare

Un metodo migliora come gli assistenti vocali riconoscono parole poco comuni usando il contesto.

2025-11-10T23:54:50+00:00 ― 6 leggere min

Suono Rivoluzionare le Tecniche di Doppiaggio Automatico

Un nuovo framework migliora il doppiaggio catturando gli stili di parlato attraverso le lingue.

2025-11-10T23:06:15+00:00 ― 8 leggere min

Suono Nuovo metodo per analizzare il jitter audio

Un modo nuovo per misurare il jitter usando l'analisi delle zero-crossing nell'attrezzatura audio.

2025-11-10T18:27:30+00:00 ― 7 leggere min

Suono Progressi nelle Tecniche di Separazione Universale delle Sorgenti

Un nuovo framework utilizza dati debolmente etichettati per una separazione audio efficace.

2025-11-10T11:46:05+00:00 ― 7 leggere min

Suono Avanzamenti nella sintesi vocale con CoMoSpeech

CoMoSpeech migliora la velocità e la qualità della sintesi vocale con un processo in un solo passaggio.

2025-11-10T05:17:25+00:00 ― 4 leggere min

Suono Sviluppi nelle tecniche di separazione musicale

Nuovi benchmark migliorano i modelli di separazione audio per musica e intrattenimento.

2025-11-10T02:03:05+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella tecnologia di riconoscimento vocale automatico

Nuovo metodo migliora i modelli di riconoscimento vocale riducendo la perdita di conoscenza.

2025-11-09T22:48:45+00:00 ― 4 leggere min

Calcolo e linguaggio Sfide e Soluzioni nel Riconoscimento Vocale Automatico

Esplorare le performance dell'ASR tra diversi accenti e le sue implicazioni.

2025-11-09T16:20:05+00:00 ― 6 leggere min

Suono Approcci Innovativi alla Riorganizzazione della Musica

Un nuovo metodo per creare versioni musicali uniche riorganizzando pezzi già esistenti.

2025-11-09T15:31:30+00:00 ― 6 leggere min

Suono Sviluppi nella Sintesi Vocale con TorToise

Un nuovo sistema migliora la generazione del parlato con risultati di alta qualità.

2025-11-09T14:42:55+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Avanzare nel Riconoscimento Vocale Grazie agli Insight Emotivi

Un nuovo modello migliora l'accuratezza del riconoscimento vocale durante il discorso emotivo.

2025-11-09T09:02:50+00:00 ― 5 leggere min

Suono Tecniche semplificate di sintesi FM e PM

Impara a usare bene FM e PM nel sound design.

2025-11-09T08:14:15+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella riduzione del rumore degli apparecchi acustici

Scopri nuovi metodi per migliorare le prestazioni degli apparecchi acustici e la chiarezza del parlato.

2025-11-09T06:37:05+00:00 ― 5 leggere min

Suono Nuovo approccio auto-supervisionato per il riconoscimento vocale

Un nuovo metodo migliora i compiti di riconoscimento vocale usando meno dati etichettati.

2025-11-09T00:08:25+00:00 ― 6 leggere min

Suono Sviluppi nelle tecniche di sottotitolazione audio

Questo articolo esamina i recenti miglioramenti nella creazione di descrizioni audio scritte.

2025-11-08T21:42:40+00:00 ― 5 leggere min

Suono Nuovo sistema di riconoscimento audio per TV

Tecnologia di riconoscimento audio efficiente progettata per dispositivi TV a basso consumo.

2025-11-08T13:36:50+00:00 ― 5 leggere min

Suono Presentiamo SCHmUBERT: Un Nuovo Modello per la Generazione Musicale

SCHmUBERT offre un approccio fresco per creare musica simbolica con l'IA.

2025-11-08T12:48:15+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Affrontare l'invasione di Pomacea canaliculata

Usare l'IA per identificare le uova di lumaca rosa invasive per una gestione migliore.

2025-11-08T11:11:05+00:00 ― 6 leggere min

Suono Progressi nella stima della fiducia per il riconoscimento vocale

Un nuovo modello aumenta i punteggi di fiducia nei sistemi di riconoscimento vocale.

2025-11-08T02:16:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nel Riconoscimento del Parlato Disartrico

Nuove tecniche migliorano la comprensione del linguaggio disartrico nei sistemi di comunicazione.

2025-11-08T01:28:05+00:00 ― 5 leggere min

Suono Progressi nelle Tecniche di Separazione del Parlato

Un nuovo approccio non supervisionato migliora l'isolamento della voce nei mix audio.

2025-11-07T23:50:55+00:00 ― 4 leggere min

Suono ML-SUPERB: Valutazione dei modelli di parlato multilingue

Un nuovo benchmark per valutare i modelli di machine learning nella comprensione del parlato tra le lingue.

2025-11-07T23:02:20+00:00 ― 6 leggere min