Informatica - Suono

RSS

Calcolo e linguaggio Avanzamenti nel riconoscimento delle emozioni nella voce

Un nuovo metodo migliora il rilevamento delle emozioni nel parlato usando tecniche di self-attention.

2025-11-12T06:41:00+00:00 ― 5 leggere min

Articoli più recenti

Elaborazione dell'audio e del parlato Fast Conformer: Avanzando nel Riconoscimento Vocale

2025-11-11T20:09:25+00:00 ― 5 leggere min

Suono SE-Bridge: Una soluzione veloce per la chiarezza del parlato

2025-11-11T15:12:12+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nella tecnologia da parlato a canto

2025-11-11T12:52:10+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Tecnologia del linguaggio e rischi per la privacy

2025-11-11T11:15:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato QVoice: Il tuo partner nella pronuncia araba

2025-11-11T08:49:15+00:00 ― 5 leggere min

Articoli più recenti

Suono Riparare le lacune nell'audio del parlato con l'apprendimento automatico

Questo articolo parla di come il machine learning colma le lacune nell'audio vocale.

2025-11-11T07:12:05+00:00 ― 6 leggere min

Suono Sviluppi nella Rilevazione di Deepfake Audio con Tecniche Stereo

Un nuovo modello migliora il rilevamento di clip audio false attraverso l'analisi stereo.

2025-11-11T07:02:24+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Nuovo metodo per la localizzazione delle sorgenti sonore usando tre microfoni

Questo metodo aiuta le persone con problemi uditivi a individuare le fonti sonore nel loro ambiente.

2025-11-11T05:34:55+00:00 ― 6 leggere min

Suono Avanzamenti nella tecnologia di miglioramento del suono

Esplora le ultime tecniche per migliorare la chiarezza del parlato in ambienti rumorosi.

2025-11-11T04:46:20+00:00 ― 6 leggere min

Suono Avanzamenti nella separazione audio con AudioSlots

AudioSlots migliora la chiarezza del suono separando efficacemente le registrazioni audio miste.

2025-11-11T03:57:45+00:00 ― 5 leggere min

Suono Creare Cantanti Digitali: Un Nuovo Approccio

Un metodo per creare voci cantanti senza etichettatura vocale dettagliata.

2025-11-11T00:43:25+00:00 ― 7 leggere min

Calcolo e linguaggio Migliorare il Riconoscimento Vocale per Parole Rare

Un metodo migliora come gli assistenti vocali riconoscono parole poco comuni usando il contesto.

2025-11-10T23:54:50+00:00 ― 6 leggere min

Suono Rivoluzionare le Tecniche di Doppiaggio Automatico

Un nuovo framework migliora il doppiaggio catturando gli stili di parlato attraverso le lingue.

2025-11-10T23:06:15+00:00 ― 8 leggere min

Suono Nuovo metodo per analizzare il jitter audio

Un modo nuovo per misurare il jitter usando l'analisi delle zero-crossing nell'attrezzatura audio.

2025-11-10T18:27:30+00:00 ― 7 leggere min

Suono Progressi nelle Tecniche di Separazione Universale delle Sorgenti

Un nuovo framework utilizza dati debolmente etichettati per una separazione audio efficace.

2025-11-10T11:46:05+00:00 ― 7 leggere min

Suono Avanzamenti nella sintesi vocale con CoMoSpeech

CoMoSpeech migliora la velocità e la qualità della sintesi vocale con un processo in un solo passaggio.

2025-11-10T05:17:25+00:00 ― 4 leggere min

Suono Sviluppi nelle tecniche di separazione musicale

Nuovi benchmark migliorano i modelli di separazione audio per musica e intrattenimento.

2025-11-10T02:03:05+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella tecnologia di riconoscimento vocale automatico

Nuovo metodo migliora i modelli di riconoscimento vocale riducendo la perdita di conoscenza.

2025-11-09T22:48:45+00:00 ― 4 leggere min

Calcolo e linguaggio Sfide e Soluzioni nel Riconoscimento Vocale Automatico

Esplorare le performance dell'ASR tra diversi accenti e le sue implicazioni.

2025-11-09T16:20:05+00:00 ― 6 leggere min

Suono Approcci Innovativi alla Riorganizzazione della Musica

Un nuovo metodo per creare versioni musicali uniche riorganizzando pezzi già esistenti.

2025-11-09T15:31:30+00:00 ― 6 leggere min

Suono Sviluppi nella Sintesi Vocale con TorToise

Un nuovo sistema migliora la generazione del parlato con risultati di alta qualità.

2025-11-09T14:42:55+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Avanzare nel Riconoscimento Vocale Grazie agli Insight Emotivi

Un nuovo modello migliora l'accuratezza del riconoscimento vocale durante il discorso emotivo.

2025-11-09T09:02:50+00:00 ― 5 leggere min

Suono Tecniche semplificate di sintesi FM e PM

Impara a usare bene FM e PM nel sound design.

2025-11-09T08:14:15+00:00 ― 6 leggere min

Suono Nuovo approccio auto-supervisionato per il riconoscimento vocale

Un nuovo metodo migliora i compiti di riconoscimento vocale usando meno dati etichettati.

2025-11-09T00:08:25+00:00 ― 6 leggere min

Suono Sviluppi nelle tecniche di sottotitolazione audio

Questo articolo esamina i recenti miglioramenti nella creazione di descrizioni audio scritte.

2025-11-08T21:42:40+00:00 ― 5 leggere min

Suono Nuovo sistema di riconoscimento audio per TV

Tecnologia di riconoscimento audio efficiente progettata per dispositivi TV a basso consumo.

2025-11-08T13:36:50+00:00 ― 5 leggere min

Suono Presentiamo SCHmUBERT: Un Nuovo Modello per la Generazione Musicale

SCHmUBERT offre un approccio fresco per creare musica simbolica con l'IA.

2025-11-08T12:48:15+00:00 ― 6 leggere min

Suono Progressi nella stima della fiducia per il riconoscimento vocale

Un nuovo modello aumenta i punteggi di fiducia nei sistemi di riconoscimento vocale.

2025-11-08T02:16:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nel Riconoscimento del Parlato Disartrico

Nuove tecniche migliorano la comprensione del linguaggio disartrico nei sistemi di comunicazione.

2025-11-08T01:28:05+00:00 ― 5 leggere min

Suono Progressi nelle Tecniche di Separazione del Parlato

Un nuovo approccio non supervisionato migliora l'isolamento della voce nei mix audio.

2025-11-07T23:50:55+00:00 ― 4 leggere min

Suono ML-SUPERB: Valutazione dei modelli di parlato multilingue

Un nuovo benchmark per valutare i modelli di machine learning nella comprensione del parlato tra le lingue.

2025-11-07T23:02:20+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare la classificazione delle fonemi nel riconoscimento vocale

Questo articolo parla di metodi per migliorare la classificazione dei telefoni usando le caratteristiche audio.

2025-11-07T21:25:10+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Avanzando l'IA: Comprensione Audio Simile agli Umani

Un nuovo modello migliora la percezione audio e le capacità di ragionamento nell'AI.

2025-11-07T16:33:40+00:00 ― 6 leggere min

Suono Progressi nella Separazione del Parlato con NASS

NASS migliora l'isolamento vocale in ambienti rumorosi, superando i metodi tradizionali.

2025-11-07T15:45:05+00:00 ― 5 leggere min

Suono Aggiornare le metriche di qualità del suono per una maggiore accuratezza

Migliorare le metriche di qualità del suono usando nuovi metodi di calcolo del volume.

2025-11-07T12:30:45+00:00 ― 5 leggere min

Calcolo e linguaggio Progressi nella Traduzione Vocale in Tempo Reale

AlignAtt migliora la traduzione del discorso simultanea con una velocità e una qualità superiori.

2025-11-07T11:42:10+00:00 ― 5 leggere min

Suono Bilanciare privacy ed efficienza nei modelli di linguaggio

Un nuovo metodo garantisce la privacy nella classificazione del linguaggio senza compromettere le prestazioni.

2025-11-07T10:05:00+00:00 ― 6 leggere min

Suono Adattare gli accenti della sintesi vocale con facilità

Questo studio mostra come adattare la tecnologia TTS a diversi accenti in modo efficiente.

2025-11-07T09:16:25+00:00 ― 5 leggere min

Interazione uomo-macchina Avanzare Agenti Socialmente Interattivi con il Modello AMII

Il modello AMII migliora la comunicazione per agenti socialmente interattivi attraverso un comportamento non verbale migliore.

2025-11-07T08:27:50+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Un Nuovo Modello per l'Elaborazione di Dati Multi-Modali

Presentiamo un modello che integra diversi tipi di dati per compiti complessi.

2025-11-07T05:13:30+00:00 ― 6 leggere min

Suono Progressi nella Rilevazione Sonora Bioacustica

I ricercatori stanno migliorando il modo in cui rileviamo automaticamente i suoni degli animali.

2025-11-07T05:03:27+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Le versatili abilità di riconoscimento vocale di Whisper

Scopri come Whisper si adatta a diversi compiti di parola usando l'ingegneria dei prompt.

2025-11-07T04:24:55+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato FastFit: Un Nuovo Approccio alla Generazione del Parlato

FastFit migliora la velocità di generazione del parlato senza perdere qualità del suono.

2025-11-07T00:22:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nel riconoscimento delle parole chiave con TACos

Un nuovo metodo migliora il rilevamento delle parole chiave nelle registrazioni audio.

2025-11-06T23:33:25+00:00 ― 5 leggere min

Suono Sviluppi nella diarizzazione degli speaker con AED-EEND

Il sistema AED-EEND migliora la diarizzazione degli speaker integrando tecniche avanzate per una precisione migliore.

2025-11-06T20:19:05+00:00 ― 5 leggere min