Informatica - Suono

RSS

Suono Composer: Un Nuovo Modo per Creare Musica dalle Parole

Il compositore usa dei prompt testuali per creare composizioni musicali complesse in formato MIDI.

2025-06-06T12:07:50+00:00 ― 6 leggere min

Suono FruitsMusic: Analizzando le canzoni dei gruppi idol giapponesi

Una risorsa per studiare i modelli vocali nella musica idol giapponese.

2025-06-06T10:30:40+00:00 ― 6 leggere min

Suono Avanzando la sintesi del suono del violino con ViolinDiff

ViolinDiff migliora il realismo della musica per violino generata al computer.

2025-06-06T09:42:05+00:00 ― 5 leggere min

Suono Sviluppi nella classificazione dei suoni sottomarini usando il deep learning

Combinare le caratteristiche migliora l'accuratezza nella classificazione dei suoni sott'acqua.

2025-06-06T04:50:35+00:00 ― 6 leggere min

Suono Sviluppi nel riconoscimento acustico dei bersagli sottomarini

Il transfer learning migliora la classificazione audio per la rilevazione dei suoni sottomarini.

2025-06-06T04:02:00+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli V-AURA: Avanzare nell'Integrazione Video-Audio

Un nuovo modello crea audio che si abbina al video, migliorando le esperienze media.

2025-06-05T23:59:05+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare i sistemi ASR con liste di parole chiave e modelli linguistici

Un metodo per potenziare il riconoscimento automatico del parlato mescolando liste di parole chiave con modelli linguistici.

2025-06-05T20:44:45+00:00 ― 5 leggere min

Grafica Imitare i Suoni: Unire Umani e Macchine

Uno studio sulle tecniche di imitazione vocale usando la tecnologia per migliorare la comunicazione.

2025-06-05T19:56:10+00:00 ― 5 leggere min

Calcolo e linguaggio Metodi innovativi per il riconoscimento vocale con dati limitati

Scopri come allenare efficacemente modelli di linguaggio con meno risorse etichettate.

2025-06-05T19:07:35+00:00 ― 7 leggere min

Calcolo e linguaggio Rivalutare il genere nella ricerca sulla tecnologia del linguaggio

Un'analisi della terminologia di genere nella tecnologia vocale e le sue implicazioni sociali.

2025-06-05T15:53:15+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Avanzare nella Rilevazione di Eventi Sonori con un Nuovo Framework

Un nuovo framework migliora la rilevazione di eventi sonori sovrapposti in ambienti audio complessi.

2025-06-05T13:27:30+00:00 ― 6 leggere min

Suono Usare il Machine Learning per la classificazione dei canti degli uccelli

Ricerche per migliorare l'identificazione dei suoni degli uccelli tramite tecniche di machine learning.

2025-06-05T10:13:10+00:00 ― 7 leggere min

Suono Avanzare nella generazione di cover per pianoforte tramite tecniche AMT

Un nuovo metodo migliora la creazione automatica di cover per pianoforte usando la tecnologia di trascrizione musicale esistente.

2025-06-05T07:47:25+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Valutare i codec audio neurali: intuizioni dalla sfida Codec-SUPERB

Uno sguardo ai risultati della sfida Codec-SUPERB e ai metodi di misurazione delle performance del codec.

2025-06-05T06:58:50+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzando la comunicazione medica con la tecnologia ASR

Il progetto MultiMed migliora il riconoscimento vocale automatico per una comunicazione sanitaria migliore.

2025-06-05T06:10:15+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Nuovi metodi per misurare la qualità audio

Un modo nuovo per valutare la qualità audio senza bisogno di riferimenti puliti.

2025-06-05T05:21:40+00:00 ― 6 leggere min

Suono Migliorare la classificazione dei suoni ambientali con il framework ECHO

Il framework ECHO migliora l'accuratezza della classificazione del suono usando etichette strutturate e un processo di apprendimento in due fasi.

2025-06-05T04:33:05+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Combinare segnali audio e visivi per un parlato più chiaro

Nuovo metodo migliora la chiarezza del parlato integrando informazioni visive.

2025-06-04T22:53:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la Stima della Direzione del Suono in Ambienti Rumorosi

Un nuovo approccio migliora la stima della direzione del suono per relatori in movimento in situazioni difficili.

2025-06-04T19:38:40+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Progressi nella tecnologia di recupero audio in tempo reale

Il recupero di momenti audio permette di individuare momenti specifici in registrazioni lunghe.

2025-06-04T13:10:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la sicurezza nel VR sociale con Safe Guard

Safe Guard rileva discorsi d'odio in tempo reale durante le interazioni vocali nella VR sociale.

2025-06-04T11:32:50+00:00 ― 6 leggere min

Calcolo e linguaggio Sviluppi nei Sistemi di Dialogo AI: Un Nuovo Approccio

L'IA sta evolvendo per avere conversazioni più naturali.

2025-06-04T10:44:15+00:00 ― 6 leggere min

Elaborazione di immagini e video Nuovo metodo visualizza il movimento del tratto vocale nel parlato

Un approccio nuovo usa la risonanza magnetica in tempo reale per visualizzare i movimenti della produzione del parlato.

2025-06-04T09:07:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Stima delle prime riflessioni in stanza con il metodo FF-PHALCOR

Un nuovo metodo per rilevare le prime riflessioni in una stanza migliora l'esperienza audio.

2025-06-04T07:29:55+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Costruire Dataset di Parlato Migliori per Lingue Sottovalutate

Un progetto che sviluppa dataset di parlato e testo per lingue con risorse limitate.

2025-06-04T06:41:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare la verifica dell'oratore con CA-MHFA

Un nuovo framework migliora il riconoscimento vocale e si adatta a vari compiti di parlato.

2025-06-04T05:52:45+00:00 ― 4 leggere min

Suono Affrontare l'aumento della rilevazione del discorso deepfake

Sono necessari nuovi metodi per rilevare le tecnologie di sintesi vocale deepfake avanzate.

2025-06-04T05:04:10+00:00 ― 6 leggere min

Suono Migliorare il Riconoscimento degli Eventi Bioacustici con Nuove Strategie

Nuovi metodi aumentano l'accuratezza nell'identificare i suoni degli animali da dati limitati.

2025-06-04T04:15:35+00:00 ― 5 leggere min

Suono Progressi nel Design Sonoro in Realtà Aumentata

Nuovo metodo migliora l'integrazione del suono virtuale negli ambienti AR.

2025-06-04T00:12:40+00:00 ― 6 leggere min

Suono Avanzando la privacy vocale con nuove tecniche di conversione

Un nuovo metodo punta a preservare la privacy della voce mentre consente una comunicazione efficace.

2025-06-03T23:24:05+00:00 ― 5 leggere min

Calcolo e linguaggio Sviluppi nelle Tecniche di Elaborazione del Parlato Senza Testo

Nuovi metodi migliorano il riconoscimento vocale per lingue a bassa risorsa senza testo.

2025-06-03T18:32:35+00:00 ― 5 leggere min

Calcolo e linguaggio Migliorare il Riconoscimento Vocale con Tecniche Fonetiche

Nuovi metodi migliorano l'accuratezza nei sistemi di riconoscimento vocale usando la comprensione fonetica.

2025-06-03T16:55:25+00:00 ― 6 leggere min

Multimedia Un nuovo sistema per la generazione in tempo reale di discorsi e gesti

Questo framework migliora le animazioni in tempo reale sincronizzando alla perfezione il parlato e i gesti.

2025-06-03T15:18:15+00:00 ― 5 leggere min

Suono Migliorare il riconoscimento vocale con caratteristiche ispirate all'uomo

Nuove caratteristiche acustiche migliorano le prestazioni dei sistemi ASR in ambienti rumorosi.

2025-06-03T14:29:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzando nel trattamento del linguaggio con coerenza nella ricostruzione di fase

Una nuova funzione di perdita migliora la qualità audio allineando fase e ampiezza.

2025-06-03T12:03:55+00:00 ― 6 leggere min

Suono Nuovo modello rende il testo in voce più umano

Un nuovo modello TTS aggiunge profondità emotiva alla voce generata dal computer.

2025-06-03T09:38:10+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale per le conversazioni tra bambini e adulti

Valutare i modelli di riconoscimento vocale per le sessioni di diagnosi dell'autismo.

2025-06-03T08:01:00+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nelle tecniche di ripristino della voce

Metodi recenti migliorano la chiarezza e la qualità audio usando modelli avanzati.

2025-06-03T07:12:25+00:00 ― 6 leggere min

Suono Nuovo Metodo per Rilevare Deepfake Vocali

Un nuovo approccio migliora il rilevamento delle registrazioni audio false.

2025-06-03T05:35:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nei Codec Neurali con ESPnet-Codec

ESPnet-Codec migliora l'addestramento e la valutazione dei codec neurali per audio e parlato.

2025-06-03T03:09:30+00:00 ― 7 leggere min