Informatica - Suono

RSS

Calcolo e linguaggio Wav2Vec2.0 e il Suono del Riconoscimento Vocale

Questo articolo parla di come Wav2Vec2.0 elabora i suoni della voce usando la fonologia.

2025-07-23T05:35:45+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzamenti nell'anonimizzazione dei parlanti multilingue

Migliorare la tecnologia di anonimizzazione dei parlanti per nove lingue per garantire la privacy.

2025-07-23T03:58:35+00:00 ― 5 leggere min

Metodi quantitativi Acquacoltura Digitale: Il Futuro della Pesca

Esplorare il ruolo della tecnologia nel migliorare l'efficienza e il benessere nell'acquacoltura.

2025-07-23T03:15:54+00:00 ― 6 leggere min

Suono Nuovo metodo per la rilevazione precoce della demenza tramite analisi vocale

Un nuovo approccio combina l'analisi vocale con la protezione della privacy per la rilevazione della demenza.

2025-07-22T19:04:10+00:00 ― 6 leggere min

Suono Avanzando nella classificazione automatica dei suoni degli animali

Nuovi metodi migliorano l'accuratezza nell'identificare i suoni degli animali per il monitoraggio della fauna selvatica.

2025-07-22T18:15:35+00:00 ― 4 leggere min

Suono Sviluppi nel riconoscimento vocale multi-parlante

Un nuovo metodo migliora l'accuratezza nel riconoscere il parlato di più persone.

2025-07-22T10:58:20+00:00 ― 5 leggere min

Suono Sviluppi nella Sintesi Vocale Usando BPE Acustico

Il BPE acustico migliora l'intelligibilità e la qualità del parlato nei sistemi TTS.

2025-07-22T08:32:35+00:00 ― 6 leggere min

Suono Sviluppi nella tecnologia di miglioramento del suono

Un nuovo metodo migliora la chiarezza del parlato in ambienti rumorosi usando reti neurali duali.

2025-07-22T06:55:25+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzando il Riconoscimento Vocale con Codici Specifici per Accenti

Nuovo metodo migliora la gestione degli accenti nei sistemi ASR tramite codici specializzati.

2025-07-22T04:29:40+00:00 ― 5 leggere min

Calcolo e linguaggio Progressi nella tecnologia di riconoscimento automatico del parlato

Nuovi metodi migliorano l'accuratezza e l'efficienza nei sistemi di riconoscimento vocale.

2025-07-22T03:41:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzando la localizzazione delle sorgenti sonore con DOA-PNN

Un nuovo metodo migliora la localizzazione del suono in ambienti diversi concentrandosi sull'apprendimento continuo.

2025-07-22T02:03:55+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella Rilevazione degli Eventi Sonori con UCIL

Un nuovo metodo migliora il riconoscimento degli eventi sonori integrando efficacemente nuove classi audio.

2025-07-22T01:15:20+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Avanzando nella rilevazione di eventi sonori con il dataset WildDESED

WildDESED migliora i sistemi di rilevamento sonoro in ambienti domestici rumorosi.

2025-07-22T00:26:45+00:00 ― 6 leggere min

Neuroni e cognizione Esplorare come la musica influisca sul cervello

Uno studio rivela come diversi generi musicali attivano aree cerebrali distinte.

2025-07-21T22:25:24+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Linee guida per le sottomissioni di articoli NeurIPS 2024

Regole fondamentali per inviare articoli a NeurIPS 2024.

2025-07-21T22:01:00+00:00 ― 4 leggere min

Architettura hardware Migliorare l'efficienza della MUSICA attraverso il calcolo approssimato

Questo articolo parla di come migliorare la MUSICA con il calcolo approssimato per ottenere prestazioni migliori.

2025-07-21T16:20:55+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato YourMT3+: Sviluppi nella tecnologia di trascrizione musicale

Un nuovo sistema migliora l'accuratezza e l'efficienza nella trascrizione musicale multi-strumento.

2025-07-21T15:32:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Seed-ASR: Avanzare nella tecnologia di riconoscimento vocale

Un nuovo modello migliora la precisione nelle capacità di trascrizione vocale in più lingue.

2025-07-21T14:43:45+00:00 ― 5 leggere min

Suono Migliorare il monitoraggio della qualità del suono sui dispositivi

Sviluppi nel prevedere la qualità del parlato usando metodi efficienti per dispositivi mobili.

2025-07-21T13:55:10+00:00 ― 5 leggere min

Suono Sfruttare il timbro nella produzione musicale con i sintetizzatori

Un metodo per migliorare il timbro nella produzione musicale attraverso i sintetizzatori.

2025-07-21T13:06:35+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzare la tecnologia del parlato per l'arabo tunisino

Questo studio valuta la tecnologia vocale in lingue a basso costo come l'arabo tunisino.

2025-07-21T12:18:00+00:00 ― 5 leggere min

Suono Vulnerabilità nei sistemi di riconoscimento vocale svelata

La ricerca rivela rischi nei modelli di riconoscimento vocale multitasking come Whisper.

2025-07-21T09:52:15+00:00 ― 5 leggere min

Calcolo e linguaggio TokenVerse: Semplificare l'analisi delle conversazioni

TokenVerse semplifica l'analisi delle conversazioni parlate integrando più compiti in un unico modello.

2025-07-21T08:15:05+00:00 ― 6 leggere min

Suono Avanzare nella generazione audio con il dataset Sound-VECaps

Nuovo dataset migliora la generazione audio da descrizioni testuali dettagliate.

2025-07-21T07:26:30+00:00 ― 5 leggere min

Suono Collegare Arte e IA: Nuovi Metodi di Interazione

Un modo nuovo per gli artisti di collegare la creatività con la generazione audio dell'IA.

2025-07-21T06:37:55+00:00 ― 6 leggere min

Suono L'ascesa dei modelli da testo a musica nella creazione musicale

Esplorare l'impatto dei modelli TTM sulla creazione musicale e sulle esperienze degli utenti.

2025-07-21T05:49:20+00:00 ― 7 leggere min

Calcolo e linguaggio Valutare i sistemi di diarizzazione degli speaker online

Questo articolo esamina la latenza di vari sistemi di diarizzazione degli speaker nell'elaborazione audio.

2025-07-21T04:12:10+00:00 ― 6 leggere min

Calcolo e linguaggio LearnerVoice: Potenziamento del Riconoscimento Vocale per gli Studenti di Lingue

Nuovo dataset punta a migliorare il riconoscimento vocale per i parlanti non nativi dell'inglese.

2025-07-21T02:35:00+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzare il riconoscimento delle emozioni nelle conversazioni

Un nuovo framework, BiosERC, migliora il riconoscimento delle emozioni tenendo conto delle caratteristiche del parlante.

2025-07-21T01:46:25+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Capire la simpatia della voce nel design tecnologico

Questo studio esamina come le preferenze vocali variano tra diversi ascoltatori.

2025-07-21T00:57:50+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Nuovo metodo per creare suono da video e testo

Questo articolo presenta un metodo per generare suoni precisi da video e testo.

2025-07-20T16:03:25+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nella Sintesi del Suono delle corde

Un nuovo modello migliora la simulazione degli strumenti a corde per un suono realistico.

2025-07-20T15:14:50+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Un nuovo modo per modificare i suoni del parlato

Introducendo un metodo per avere un controllo migliore nell'editing del parlato.

2025-07-20T12:49:05+00:00 ― 5 leggere min

Suono Riconoscere le Epoche Musicali Attraverso Dati Audio e degli Artisti

Uno studio per classificare la musica in base all'epoca usando le caratteristiche audio e le intuizioni degli artisti.

2025-07-20T10:23:20+00:00 ― 6 leggere min

Suono Nuovo Quadro per Analizzare i Suoni degli Animali

Un nuovo modello migliora lo studio della comunicazione animale usando dati audio grezzi.

2025-07-20T10:15:44+00:00 ― 6 leggere min

Elaborazione del segnale Progressi nel trattamento dei segnali con reti neurali a impulsi

Un nuovo sistema migliora l'efficienza dell'elaborazione dei segnali tramite metodi di codifica innovativi.

2025-07-20T07:09:00+00:00 ― 6 leggere min

Suono Approcci Innovativi alla Classificazione dei Canti degli Uccelli

Un team affronta le sfide dell'identificazione dei canti degli uccelli nella competizione BirdCLEF 2024.

2025-07-20T01:28:55+00:00 ― 6 leggere min

Suono Nuovi dataset per il riconoscimento delle emozioni nella musica

Presentiamo i dataset MERGE per migliorare la classificazione delle emozioni nella musica.

2025-07-19T20:37:25+00:00 ― 6 leggere min

Suono Avanzando il riconoscimento di parole chiave Few-Shot con Mix-Training

Questo studio esamina il Mix-Training per il riconoscimento delle parole chiave in condizioni di parlato rumoroso.

2025-07-19T16:39:18+00:00 ― 5 leggere min

Apprendimento automatico Potenziare modelli piccoli con intuizioni di modelli grandi

Un nuovo metodo aiuta i modelli più piccoli a funzionare meglio usando suggerimenti dai modelli più grandi.

2025-07-19T14:08:45+00:00 ― 6 leggere min