Informatica - Suono

RSS

Suono Avanzamenti nella Sottotitolazione Audio Automatizzata

Nuovi metodi migliorano l'accessibilità e l'accuratezza nei sottotitoli audio.

2025-08-21T14:03:15+00:00 ― 6 leggere min

Suono Rilevare le chiamate audio deepfake: un nuovo approccio

Impara a riconoscere le chiamate audio fake con tecniche innovative di sfida-risposta.

2025-08-21T07:34:35+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli CustomListener: Una Nuova Era nelle Interazioni Virtuali

CustomListener crea avatar realistici che rispondono alle conversazioni in modo dinamico.

2025-08-21T05:08:50+00:00 ― 6 leggere min

Suono Progressi nelle tecniche di diarizzazione automatica degli speaker

La ricerca mette in evidenza l'importanza del timing rispetto a caratteristiche specifiche degli speaker nei modelli di diarizzazione.

2025-08-21T00:17:20+00:00 ― 6 leggere min

Multimedia Avanzamenti nella tecnologia da labiale a parlato

Nuovo metodo migliora la sintesi vocale per le persone che non possono parlare.

2025-08-20T20:14:25+00:00 ― 7 leggere min

Interazione uomo-macchina Progressi nelle Interfacce di Parola Silenziosa

Uno sguardo a MONA, un sistema che migliora la comunicazione del parlato silenzioso.

2025-08-20T16:11:30+00:00 ― 5 leggere min

Suono Capire la tecnologia di riconoscimento vocale automatico

Una panoramica dell'ASR e dei suoi progressi nelle applicazioni moderne.

2025-08-20T15:22:55+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nel Riconoscimento delle Emozioni nella Voce con il Database EMOVOME

Esplorare nuovi metodi per migliorare il riconoscimento delle emozioni nel parlato usando dati naturali.

2025-08-20T01:37:00+00:00 ― 6 leggere min

Robotica Migliorare il riconoscimento vocale dei robot in ambienti rumorosi

La ricerca si concentra su come aiutare i robot a capire meglio il linguaggio tra il rumore di fondo.

2025-08-19T22:22:40+00:00 ― 6 leggere min

Suono Automatizzare la Valutazione della Difficoltà Musicale Utilizzando l'Analisi Audio

Questo studio fa un passo avanti nell'educazione musicale automatizzando la valutazione della difficoltà dei pezzi per pianoforte.

2025-08-19T21:34:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Valutare il riconoscimento vocale in ambienti rumorosi

Un nuovo benchmark valuta le prestazioni dei sistemi di riconoscimento vocale in mezzo a vari disturbi.

2025-08-19T14:16:50+00:00 ― 5 leggere min

Suono Il futuro dell'IA nella creazione musicale

Esplorando il ruolo dell'IA nel plasmare la musica attraverso tecniche e strutture avanzate.

2025-08-18T14:47:55+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare i modelli di parola con RobustDistiller

Un nuovo metodo migliora le prestazioni del modello di parlato e l'efficienza in ambienti rumorosi.

2025-08-18T05:53:30+00:00 ― 6 leggere min

Suono Neural-SRP: Avanzando la Localizzazione delle Sorgenti Sonore

Un nuovo metodo combina tecniche tradizionali con reti neurali per una migliore localizzazione del suono.

2025-08-17T23:24:50+00:00 ― 5 leggere min

Suono Avanzare nel Rilevamento Acustico con il Deep Learning

Un nuovo modo per migliorare il rilevamento acustico senza compromettere la qualità audio.

2025-08-17T20:59:05+00:00 ― 7 leggere min

Suono Avanzamenti nella generazione di gesti dalla parola

Un nuovo sistema migliora la creazione di gesti realistici usando solo l'audio della voce.

2025-08-17T14:30:25+00:00 ― 6 leggere min

Suono Notochord: Un Nuovo Strumento MIDI per Musicisti

Notochord migliora la creazione di musica MIDI in tempo reale usando l'IA per performance più ricche.

2025-08-17T06:24:35+00:00 ― 6 leggere min

Suono Prompt-Singer: Un Nuovo Approccio al Controllo della Voce Cantante

Un metodo per avere un controllo più intuitivo sulle voci cantanti usando comandi in linguaggio naturale.

2025-08-17T01:33:05+00:00 ― 7 leggere min

Suono Sviluppi nel Riconoscimento delle Emozioni nella Voce con emoDARTS

Il nuovo modello emoDARTS migliora l'accuratezza nel riconoscere le emozioni nella voce usando il deep learning.

2025-08-16T17:27:15+00:00 ― 7 leggere min

Suono Avanzamenti nelle caratteristiche vocali del Text-to-Speech

Uno studio per migliorare i sistemi TTS con campioni vocali diversi.

2025-08-16T12:35:45+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Evoluzioni nella tecnologia di editing vocale

Nuovi strumenti migliorano l'editing delle registrazioni vocali e la qualità della produzione.

2025-08-15T09:03:55+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Avanzamenti nella tecnologia di accompagnamento per la danza

Nuovi modelli migliorano le interazioni in duetto nelle performance di danza virtuali.

2025-08-14T21:43:45+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Rivivere la Storia: L'Arte del Restauro Audio

Scopri come l'equalizzazione generativa ridà vita ai vecchi brani musicali.

2025-08-14T20:06:35+00:00 ― 7 leggere min

Calcolo e linguaggio Classificare i sottodialetti kurdi sorani attraverso dati audio

La ricerca identifica e classifica i dialetti curdi sorani usando registrazioni audio estese.

2025-08-14T07:57:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Automatizzare la regolazione del suono per acustiche realistiche

Un nuovo metodo migliora l'elaborazione del suono tramite la sintonizzazione automatica delle Reti di Ritardo di Feedback.

2025-08-14T07:09:15+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Progressi nella valutazione automatica della qualità del parlato

Un nuovo metodo migliora la valutazione del parlato usando registrazioni intere.

2025-08-14T06:20:40+00:00 ― 8 leggere min

Suono Misurare l'Adesione nei Modelli di Musica Generativa

Un nuovo modo per valutare quanto bene la musica segua i segnali audio.

2025-08-13T23:03:25+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Presentiamo il dataset 360+x per una comprensione migliorata delle scene

Un nuovo set di dati migliora il modo in cui i robot interpretano gli ambienti reali.

2025-08-13T18:11:55+00:00 ― 7 leggere min

Suono Nuovo approccio alla separazione audio usando il linguaggio

Questo metodo migliora la separazione audio combinando descrizioni linguistiche con analisi del suono.

2025-08-13T14:57:35+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Presentiamo UniAV: Un Approccio Unificato alla Localizzazione dei Video

UniAV combina localizzazione dell'azione, rilevamento del suono e localizzazione degli eventi audio-visivi per una migliore comprensione dei video.

2025-08-13T10:06:05+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato CLaM-TTS: Avanzamento della Tecnologia Text-to-Speech

CLaM-TTS migliora la sintesi vocale usando tecniche avanzate per una resa migliore e più efficiente.

2025-08-13T08:28:55+00:00 ― 6 leggere min

Reti sociali e informative Analizzare la musica attraverso i grafici

I grafici permettono di avere nuove intuizioni sulla struttura e le relazioni della musica.

2025-08-13T03:09:57+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il Text-to-Speech con RALL-E

RALL-E migliora la sintesi testo-parola per un parlato più chiaro e naturale.

2025-08-13T01:11:40+00:00 ― 5 leggere min

Suono Sviluppi nel Modello Audio Analogico Virtuale

Esplorare tecniche di machine learning per modellare effetti audio analogici.

2025-08-12T22:37:18+00:00 ― 6 leggere min

Suono MuPT: Avanzare nella Generazione Musicale con la Notazione ABC

MuPT utilizza la notazione ABC per una generazione musicale efficace con l'IA.

2025-08-12T09:00:00+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzando l'apprendimento audio con M2D e M2D-X

Nuovi metodi migliorano la rappresentazione audio attraverso tecniche di apprendimento self-supervised.

2025-08-12T07:22:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare la Ricostruzione del Campo Sonoro con l'IA

Un metodo che usa l'IA migliora la rappresentazione del suono in diversi ambienti.

2025-08-12T00:54:10+00:00 ― 7 leggere min

Fisica classica Capire i Momenti Spettrali nei Test Elettromagnetici

Esplora il ruolo dei momenti spettrali nei test in camera di riverberazione e l'impatto del rumore.

2025-08-12T00:28:33+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Modello di trascrizione pianistica in tempo reale efficiente

Un nuovo sistema per una trascrizione di pianoforte in tempo reale, precisa e leggera.

2025-08-12T00:05:35+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Any2Point: Collegare la comprensione 3D nei modelli di IA

Un nuovo framework migliora la comprensione dell'IA degli spazi 3D.

2025-08-11T19:14:05+00:00 ― 7 leggere min