Ingegneria elettrica e scienze dei sistemi - Elaborazione dell'audio e del parlato

RSS

Calcolo e linguaggio Avanzamenti nella traduzione orale attraverso il contesto

Nuovi metodi migliorano la traduzione del parlato concentrandosi sulle informazioni contestuali.

2025-09-02T22:24:45+00:00 ― 5 leggere min

Suono Avanzando la tecnologia vocale con dati di code-switching

Un nuovo metodo migliora il riconoscimento vocale per gli utenti che alternano tra lingue.

2025-09-02T21:36:10+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sfruttare il rilevamento di suoni anomali per risultati migliori

Scopri come l'analisi del suono aiuta a identificare i problemi delle macchine in modo efficiente.

2025-09-02T20:47:35+00:00 ― 6 leggere min

Calcolo e linguaggio Progressi nella traduzione vocale e nei sottotitoli

Questo progetto migliora i sistemi di traduzione vocale in tempo reale e di sottotitolazione automatica.

2025-09-02T18:21:50+00:00 ― 4 leggere min

Suono Nuove intuizioni sulla generalizzazione nelle reti neurali

Esplorando come la nitidezza dei minimi influisca sulle prestazioni del modello su dati audio non visti.

2025-09-02T15:56:05+00:00 ― 5 leggere min

Suono Combinare Voce e Viso per una Migliore Identificazione

Nuovo metodo migliora la verifica dell'identità degli speaker unendo dati audio e visivi.

2025-09-02T07:50:15+00:00 ― 5 leggere min

Suono Transformers nella rappresentazione musicale

Uno studio sull'uso dei transformer per un tagging e una rappresentazione musicale efficace.

2025-09-02T07:01:40+00:00 ― 7 leggere min

Multimedia Avanzamenti nella localizzazione degli altoparlanti audio-visivi

Un nuovo metodo migliora il tracciamento degli speaker usando dati audio e visivi.

2025-09-02T06:13:05+00:00 ― 7 leggere min

Suono Nuovo metodo per analizzare la difficoltà della musica per pianoforte

Un nuovo modo per valutare la difficoltà della musica per pianoforte usando immagini delle partiture.

2025-09-02T05:24:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare le trascrizioni delle riunioni con il sistema PP-MeT

PP-MeT punta a migliorare l'accuratezza nella trascrizione di incontri con più partecipanti.

2025-09-02T04:35:55+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Un Approccio Universale al Miglioramento del Parlato

Questa ricerca presenta un modello per migliorare la chiarezza del discorso in diverse condizioni.

2025-09-02T02:10:10+00:00 ― 5 leggere min

Suono L'Ascesa dei Sottotitoli Audio Automatici

Esplorando i progressi nella didascalia audio automatica e il suo impatto sull'accessibilità.

2025-09-02T01:21:35+00:00 ― 5 leggere min

Suono Separazione del parlato innovativa usando dati audio e visivi

La ricerca presenta un metodo efficace per migliorare la chiarezza del parlato in ambienti rumorosi.

2025-09-02T00:33:00+00:00 ― 7 leggere min

Apprendimento automatico Avanzare nel matching dello stile audio con effetti tradizionali

Un nuovo metodo semplifica il trasferimento di stile audio usando effetti non differenziabili.

2025-09-01T19:41:30+00:00 ― 7 leggere min

Suono Valutare la qualità delle performance al pianoforte generate dal computer

La ricerca esamina come la musica computerizzata si confronta con le performance umane attraverso test di ascolto.

2025-09-01T07:32:45+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Migliorare il Design Sonoro con i Polinomi Ultrasferici

Scopri come i polinomi ultrasferici migliorano la tecnologia audio e la direzionalità del suono.

2025-09-01T05:55:35+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzare nella ricostruzione del campo sonoro con l'IA

Usare l'IA per migliorare come ricreiamo il suono in ambienti diversi.

2025-09-01T01:52:40+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzando il Riconoscimento Vocale con SSRL

Un nuovo metodo migliora il riconoscimento vocale usando meno etichette e risorse.

2025-09-01T00:15:30+00:00 ― 7 leggere min

Suono Progressi nelle tecniche di ancoraggio testo-audio

Nuovi metodi migliorano il collegamento tra descrizioni testuali e eventi sonori.

2025-08-31T16:09:40+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Rilevazione della Direzione del Suono nei Robot Mobili

Metodi innovativi migliorano il modo in cui i robot elaborano la direzione del suono mentre sono in movimento.

2025-08-31T14:32:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia del beamforming

Scopri il beamforming a valori reali e i suoi vantaggi per le array di microfoni.

2025-08-31T12:06:45+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Sviluppi nei modelli di sintesi vocale conversazionale

Un nuovo approccio per generare discorsi piccoli, efficienti e che suonano naturali.

2025-08-31T09:41:00+00:00 ― 9 leggere min

Suono Un nuovo modello per la generazione di musica con l'IA

MusicAOG semplifica la creazione e la comprensione della musica tramite un'innovativa rappresentazione grafica.

2025-08-31T08:52:25+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progettare sistemi MIMO efficaci con array sferici

Un nuovo framework per combinare array di microfoni e altoparlanti sferici negli studi sul suono.

2025-08-31T07:15:15+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progettare Sistemi Uditivi Efficaci per Robot Umani

Un nuovo framework per migliorare il rilevamento dei suoni nei robot umanoidi attraverso il design della matrice di microfoni.

2025-08-31T06:26:40+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Migliorare l'acustica della stanza con sistemi MIMO

Scopri come i sistemi MIMO migliorano l'analisi del suono in diversi ambienti.

2025-08-31T02:23:45+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella ricerca sull'acustica delle stanze

Nuove tecniche migliorano la stima della direzione del suono per vari ambienti audio.

2025-08-31T01:35:10+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Controllare il suono per esperienze di ascolto più chiare

La ricerca svela metodi per regolare il comportamento del suono nelle stanze per una maggiore chiarezza.

2025-08-31T00:46:35+00:00 ― 4 leggere min

Visione artificiale e riconoscimento di modelli Rilevare l'umorismo nei video con FunnyNet-W

Un nuovo modello identifica i momenti divertenti nei video usando dati visivi, audio e di testo.

2025-08-30T23:09:25+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progressi nei Dielettrici Elastomeri per la Tecnologia

Gli elastomeri dielettrici trasformano l'energia elettrica in movimento meccanico, offrendo diverse applicazioni.

2025-08-30T20:43:40+00:00 ― 7 leggere min

Calcolo e linguaggio Utilizzare la tecnologia ASR per aiutare nella diagnosi della demenza

I trascrizioni ASR con errori possono aiutare a identificare l'Alzheimer in modo più preciso.

2025-08-30T16:40:45+00:00 ― 8 leggere min

Calcolo e linguaggio Presentiamo ELLA-V: Un Nuovo Capitolo nella Sintesi Vocale

ELLA-V migliora la qualità e il controllo del testo in voce, superando i modelli precedenti.

2025-08-30T01:17:40+00:00 ― 6 leggere min

Metodi quantitativi Nuovo metodo migliora il monitoraggio acustico della fauna selvatica

Un nuovo approccio migliora l'accuratezza nella rilevazione dei richiami animali senza soglie arbitrarie.

2025-08-29T23:46:39+00:00 ― 7 leggere min

Calcolo e linguaggio Avanzare nella classificazione del parlato con dati multimodali

Un nuovo modello integra audio e testo per una migliore classificazione del parlato.

2025-08-29T18:49:00+00:00 ― 7 leggere min

Suono NOTSOFAR-1 Challenge: Avanzare la tecnologia di trascrizione delle riunioni

Una nuova iniziativa per migliorare la tecnologia di trascrizione per le riunioni in grandi stanze.

2025-08-29T16:23:15+00:00 ― 7 leggere min

Calcolo e linguaggio Progressi nella correzione degli errori di riconoscimento vocale

Nuovi metodi migliorano la precisione nel riconoscimento vocale rumoroso utilizzando modelli linguistici grandi.

2025-08-29T01:48:45+00:00 ― 6 leggere min

Suono Capire le Vocalizzazioni delle Galline per un Farming Migliore

Analizzare i suoni delle galline aiuta a migliorare la loro salute e la produttività della fattoria.

2025-08-29T00:11:35+00:00 ― 8 leggere min

Interazione uomo-macchina Sound Unblending: Un Nuovo Strumento per la Realtà Mista

Un metodo per aiutare i non vedenti a riconoscere i suoni nella realtà mista.

2025-08-28T20:57:15+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Affrontare le sfide della tecnologia vocale per le lingue sotto-risorse

Questo articolo parla di soluzioni per le applicazioni vocali in lingue con dati trascritti limitati.

2025-08-28T18:31:30+00:00 ― 6 leggere min

Apprendimento automatico Progressi nella classificazione del suono usando le reti di credenza proiettate

I ricercatori combinano metodi generativi e discriminativi per migliorare la classificazione del suono.

2025-08-28T16:05:45+00:00 ― 6 leggere min