Un nuovo modello unisce dati audio e testuali per migliorare l'accuratezza del riconoscimento vocale.

2025-11-18T00:43:36+00:00 ― 5 leggere min

Articoli più recenti

Elaborazione dell'audio e del parlato Progressi nella tecnologia di morphing della texture audio

2025-11-17T21:05:50+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzare nella creazione audio tramite descrizioni testuali

2025-11-17T15:25:45+00:00 ― 5 leggere min

Suono DCASE 2023: Avanzare nella Sintesi Automatica dei Suoni Foley

2025-11-17T14:37:10+00:00 ― 5 leggere min

Suono Avanzare nella classificazione musicale con le playlist

2025-11-17T10:34:15+00:00 ― 5 leggere min

Suono Avanzamenti nel Riconoscimento Vocale Automatico con Deep Transfer Learning

2025-11-15T23:45:10+00:00 ― 6 leggere min

Articoli più recenti

Suono Un nuovo metodo per separare le voci nella musica

La tecnologia innovativa separa le voci musicali usando tecniche di tracciamento avanzate.

2025-11-15T11:36:25+00:00 ― 6 leggere min

Apprendimento automatico Nuovo metodo per monitorare le mucche in ambienti rumorosi

Ora gli agricoltori possono tracciare con precisione i comportamenti delle mucche nonostante il rumore di fondo.

2025-11-15T09:59:15+00:00 ― 7 leggere min

Suono Sviluppi nella trascrizione musicale automatica usando dati sintetizzati

Nuovi metodi nella trascrizione musicale mostrano potenzialità con dati audio sintetizzati.

2025-11-15T04:19:10+00:00 ― 6 leggere min

Suono Analizzando i pianti dei bebè: il dataset CryCeleb

Un grande dataset di pianti dei neonati aiuta a capire la comunicazione e la salute infantile.

2025-11-15T02:42:00+00:00 ― 6 leggere min

Suono Migliorare il riconoscimento delle parole chiave con CosMix

Un nuovo metodo migliora i sistemi di rilevamento delle parole chiave in condizioni a basso consumo di risorse.

2025-11-14T21:50:30+00:00 ― 5 leggere min

Suono Miglioramenti nelle previsioni del controllo del traffico aereo con il framework SIA-FTP

Un nuovo framework migliora le previsioni delle traiettorie di volo utilizzando istruzioni vocali in tempo reale.

2025-11-14T10:30:20+00:00 ― 4 leggere min

Suono Migliorare il Captioning Audio con un Nuovo Metodo di Loss

Un nuovo metodo migliora la didascalia audio generando frasi più chiare e varie.

2025-11-14T09:41:45+00:00 ― 4 leggere min

Suono LORIS: Un Nuovo Approccio alla Generazione di Musica Video

LORIS genera musica di alta qualità che si sincronizza perfettamente con i movimenti dei video.

2025-11-14T05:38:50+00:00 ― 6 leggere min

Calcolo e linguaggio Le reti neurali imparano la sintassi dal suono

Uno studio mostra che le CNN possono creare combinazioni di parole da dati vocali grezzi.

2025-11-14T02:24:30+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato PLiX: Un Nuovo Approccio al Riconoscimento Vocale

PLiX usa il few-shot learning per migliorare il riconoscimento vocale in più lingue.

2025-11-13T23:10:10+00:00 ― 8 leggere min

Suono Avanzamenti nella Rilevazione di Eventi Sonori Usando il Few-Shot Learning

Questo articolo parla di come migliorare il rilevamento delle sequenze sonore nel riconoscimento audio.

2025-11-13T20:44:25+00:00 ― 6 leggere min

Calcolo e linguaggio Separare le informazioni del parlante e fonetiche nei modelli di linguaggio

La ricerca mostra un metodo per migliorare il riconoscimento vocale separando l'identità del parlante dai suoni fonetici.

2025-11-13T16:50:30+00:00 ― 5 leggere min

Calcolo e linguaggio Impatto della Qualità Audio sull'Apprendimento delle Lingue Ricerca

Uno studio rivela come la chiarezza audio influisce sull'analisi dell'acquisizione linguistica nei neonati.

2025-11-13T14:15:45+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzamenti nei sistemi di comprensione del linguaggio parlato

Un nuovo approccio migliora la comprensione del linguaggio parlato usando un'elaborazione audio efficiente.

2025-11-13T02:07:00+00:00 ― 6 leggere min

Suono Migliorare l'efficienza delle CNN tramite potatura dei filtri

Questo documento presenta un metodo per migliorare le CNN rimuovendo filtri inutili.

2025-11-12T15:35:25+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzamenti nel riconoscimento delle emozioni nella voce

Un nuovo metodo migliora il rilevamento delle emozioni nel parlato usando tecniche di self-attention.

2025-11-12T06:41:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Fast Conformer: Avanzando nel Riconoscimento Vocale

Fast Conformer migliora la velocità e l'accuratezza del riconoscimento vocale per diverse applicazioni.

2025-11-11T20:09:25+00:00 ― 5 leggere min

Suono SE-Bridge: Una soluzione veloce per la chiarezza del parlato

SE-Bridge migliora la voce in modo veloce, rendendo tutto più chiaro per diverse applicazioni.

2025-11-11T15:12:12+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nella tecnologia da parlato a canto

La ricerca presenta un metodo per convertire parole parlate in canto in modo efficiente.

2025-11-11T12:52:10+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Tecnologia del linguaggio e rischi per la privacy

Esaminando l'impatto della tecnologia vocale sulla privacy personale.

2025-11-11T11:15:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato QVoice: Il tuo partner nella pronuncia araba

Un'app mobile pensata per migliorare la pronuncia araba per tutti gli studenti.

2025-11-11T08:49:15+00:00 ― 5 leggere min

Suono Riparare le lacune nell'audio del parlato con l'apprendimento automatico

Questo articolo parla di come il machine learning colma le lacune nell'audio vocale.

2025-11-11T07:12:05+00:00 ― 6 leggere min

Suono Sviluppi nella Rilevazione di Deepfake Audio con Tecniche Stereo

Un nuovo modello migliora il rilevamento di clip audio false attraverso l'analisi stereo.

2025-11-11T07:02:24+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Nuovo metodo per la localizzazione delle sorgenti sonore usando tre microfoni

Questo metodo aiuta le persone con problemi uditivi a individuare le fonti sonore nel loro ambiente.

2025-11-11T05:34:55+00:00 ― 6 leggere min

Suono Avanzamenti nella tecnologia di miglioramento del suono

Esplora le ultime tecniche per migliorare la chiarezza del parlato in ambienti rumorosi.

2025-11-11T04:46:20+00:00 ― 6 leggere min

Suono Avanzamenti nella separazione audio con AudioSlots

AudioSlots migliora la chiarezza del suono separando efficacemente le registrazioni audio miste.

2025-11-11T03:57:45+00:00 ― 5 leggere min

Suono Creare Cantanti Digitali: Un Nuovo Approccio

Un metodo per creare voci cantanti senza etichettatura vocale dettagliata.

2025-11-11T00:43:25+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare il Riconoscimento Vocale per Parole Rare

Un metodo migliora come gli assistenti vocali riconoscono parole poco comuni usando il contesto.

2025-11-10T23:54:50+00:00 ― 6 leggere min

Suono Rivoluzionare le Tecniche di Doppiaggio Automatico

Un nuovo framework migliora il doppiaggio catturando gli stili di parlato attraverso le lingue.

2025-11-10T23:06:15+00:00 ― 8 leggere min

Suono Nuovo metodo per analizzare il jitter audio

Un modo nuovo per misurare il jitter usando l'analisi delle zero-crossing nell'attrezzatura audio.

2025-11-10T18:27:30+00:00 ― 7 leggere min

Suono Progressi nelle Tecniche di Separazione Universale delle Sorgenti

Un nuovo framework utilizza dati debolmente etichettati per una separazione audio efficace.

2025-11-10T11:46:05+00:00 ― 7 leggere min

Suono Avanzamenti nella sintesi vocale con CoMoSpeech

CoMoSpeech migliora la velocità e la qualità della sintesi vocale con un processo in un solo passaggio.

2025-11-10T05:17:25+00:00 ― 4 leggere min

Suono Sviluppi nelle tecniche di separazione musicale

Nuovi benchmark migliorano i modelli di separazione audio per musica e intrattenimento.

2025-11-10T02:03:05+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella tecnologia di riconoscimento vocale automatico

Nuovo metodo migliora i modelli di riconoscimento vocale riducendo la perdita di conoscenza.

2025-11-09T22:48:45+00:00 ― 4 leggere min

Calcolo e linguaggio Sfide e Soluzioni nel Riconoscimento Vocale Automatico

Esplorare le performance dell'ASR tra diversi accenti e le sue implicazioni.

2025-11-09T16:20:05+00:00 ― 6 leggere min

Suono Approcci Innovativi alla Riorganizzazione della Musica

Un nuovo metodo per creare versioni musicali uniche riorganizzando pezzi già esistenti.

2025-11-09T15:31:30+00:00 ― 6 leggere min

Suono Sviluppi nella Sintesi Vocale con TorToise

Un nuovo sistema migliora la generazione del parlato con risultati di alta qualità.

2025-11-09T14:42:55+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Avanzare nel Riconoscimento Vocale Grazie agli Insight Emotivi

Un nuovo modello migliora l'accuratezza del riconoscimento vocale durante il discorso emotivo.

2025-11-09T09:02:50+00:00 ― 5 leggere min

Suono Tecniche semplificate di sintesi FM e PM

Impara a usare bene FM e PM nel sound design.

2025-11-09T08:14:15+00:00 ― 6 leggere min

Suono Nuovo approccio auto-supervisionato per il riconoscimento vocale

Un nuovo metodo migliora i compiti di riconoscimento vocale usando meno dati etichettati.

2025-11-09T00:08:25+00:00 ― 6 leggere min

Informatica - Suono