Nuovi metodi migliorano la rilevazione precoce dei problemi vocali usando le caratteristiche della sorgente glottale.

2025-09-04T10:02:25+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale per accenti diversi

Migliorare i modelli di riconoscimento vocale per capire e adattarsi meglio ai diversi accenti.

2025-09-04T08:25:15+00:00 ― 5 leggere min

Suono Sviluppi nella classificazione audio usando DCLS

DCLS migliora le performance di classificazione audio imparando le posizioni dei kernel durante l'addestramento.

2025-09-04T07:36:40+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare l'apprendimento audio-visivo con la co-augmentazione della velocità

Un nuovo metodo migliora l'apprendimento automatico dei dati audio-visivi.

2025-09-04T05:59:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia di estrazione del parlato

Introdurre nuovi modelli per estrarre meglio il parlato in ambienti rumorosi.

2025-09-04T02:45:10+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale con l'adattamento a bassa rank

Un nuovo metodo migliora l'efficienza del riconoscimento vocale usando l'adattamento a basso rango.

2025-09-04T00:19:25+00:00 ― 5 leggere min

Elaborazione del segnale Un Nuovo Approccio per Identificare i Sintomi della Schizofrenia

Combinare audio, video e testo per valutazioni della salute mentale migliori.

2025-09-03T22:42:15+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con nuove tecniche

Uno sguardo ai progressi nel riconoscimento vocale per aumentare velocità e precisione.

2025-09-03T21:05:05+00:00 ― 5 leggere min

Calcolo e linguaggio Colmare le lacune linguistiche nella sanità

Migliorare la comunicazione fra medici e pazienti con tecnologie avanzate di riconoscimento vocale.

2025-09-03T18:39:20+00:00 ― 6 leggere min

Suono La Melodia di Synthia: Un Nuovo Strumento per la Ricerca Audio

La Melodia di Synthia aiuta i ricercatori a testare modelli audio su dati diversi.

2025-09-03T14:36:25+00:00 ― 6 leggere min

Calcolo e linguaggio Affrontare le sfide nel riconoscimento automatico del parlato a lungo termine

La ricerca si concentra sul miglioramento dei sistemi ASR per audio non segmentato.

2025-09-03T13:47:50+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzando nella sintesi vocale per un audio realistico

La ricerca si concentra sull'ottimizzazione dei sintetizzatori per le vocalizzazioni umane in diversi media.

2025-09-03T09:44:55+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Verifica vocale avanzata: affrontare la variabilità tra sessioni

Un nuovo metodo migliora la verifica dell'identità del parlante gestendo efficacemente la variabilità delle sessioni.

2025-09-03T08:56:20+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il riconoscimento vocale con grandi modelli linguistici

I LLM migliorano l'accuratezza e la correzione degli errori nei sistemi di riconoscimento vocale.

2025-09-03T06:30:35+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato MC-SimCLR: Avanzando l'apprendimento sonoro e la consapevolezza della posizione

Un nuovo metodo migliora il riconoscimento dei suoni e la localizzazione delle fonti senza etichette.

2025-09-03T00:50:30+00:00 ― 6 leggere min

Calcolo e linguaggio HyPoradise: Migliorare l'accuratezza del riconoscimento vocale automatico

Un nuovo punto di riferimento per migliorare la precisione dell'ASR usando modelli di linguaggio.

2025-09-02T23:13:20+00:00 ― 6 leggere min

Calcolo e linguaggio Avanzamenti nella traduzione orale attraverso il contesto

Nuovi metodi migliorano la traduzione del parlato concentrandosi sulle informazioni contestuali.

2025-09-02T22:24:45+00:00 ― 5 leggere min

Suono Avanzando la tecnologia vocale con dati di code-switching

Un nuovo metodo migliora il riconoscimento vocale per gli utenti che alternano tra lingue.

2025-09-02T21:36:10+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Sfruttare il rilevamento di suoni anomali per risultati migliori

Scopri come l'analisi del suono aiuta a identificare i problemi delle macchine in modo efficiente.

2025-09-02T20:47:35+00:00 ― 6 leggere min

Calcolo e linguaggio Progressi nella traduzione vocale e nei sottotitoli

Questo progetto migliora i sistemi di traduzione vocale in tempo reale e di sottotitolazione automatica.

2025-09-02T18:21:50+00:00 ― 4 leggere min

Suono Nuove intuizioni sulla generalizzazione nelle reti neurali

Esplorando come la nitidezza dei minimi influisca sulle prestazioni del modello su dati audio non visti.

2025-09-02T15:56:05+00:00 ― 5 leggere min

Suono Combinare Voce e Viso per una Migliore Identificazione

Nuovo metodo migliora la verifica dell'identità degli speaker unendo dati audio e visivi.

2025-09-02T07:50:15+00:00 ― 5 leggere min

Suono Transformers nella rappresentazione musicale

Uno studio sull'uso dei transformer per un tagging e una rappresentazione musicale efficace.

2025-09-02T07:01:40+00:00 ― 7 leggere min

Multimedia Avanzamenti nella localizzazione degli altoparlanti audio-visivi

Un nuovo metodo migliora il tracciamento degli speaker usando dati audio e visivi.

2025-09-02T06:13:05+00:00 ― 7 leggere min

Suono Nuovo metodo per analizzare la difficoltà della musica per pianoforte

Un nuovo modo per valutare la difficoltà della musica per pianoforte usando immagini delle partiture.

2025-09-02T05:24:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Migliorare le trascrizioni delle riunioni con il sistema PP-MeT

PP-MeT punta a migliorare l'accuratezza nella trascrizione di incontri con più partecipanti.

2025-09-02T04:35:55+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Un Approccio Universale al Miglioramento del Parlato

Questa ricerca presenta un modello per migliorare la chiarezza del discorso in diverse condizioni.

2025-09-02T02:10:10+00:00 ― 5 leggere min

Suono L'Ascesa dei Sottotitoli Audio Automatici

Esplorando i progressi nella didascalia audio automatica e il suo impatto sull'accessibilità.

2025-09-02T01:21:35+00:00 ― 5 leggere min

Suono Separazione del parlato innovativa usando dati audio e visivi

La ricerca presenta un metodo efficace per migliorare la chiarezza del parlato in ambienti rumorosi.

2025-09-02T00:33:00+00:00 ― 7 leggere min

Apprendimento automatico Avanzare nel matching dello stile audio con effetti tradizionali

Un nuovo metodo semplifica il trasferimento di stile audio usando effetti non differenziabili.

2025-09-01T19:41:30+00:00 ― 7 leggere min

Suono Valutare la qualità delle performance al pianoforte generate dal computer

La ricerca esamina come la musica computerizzata si confronta con le performance umane attraverso test di ascolto.

2025-09-01T07:32:45+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Migliorare il Design Sonoro con i Polinomi Ultrasferici

Scopri come i polinomi ultrasferici migliorano la tecnologia audio e la direzionalità del suono.

2025-09-01T05:55:35+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Avanzando il Riconoscimento Vocale con SSRL

Un nuovo metodo migliora il riconoscimento vocale usando meno etichette e risorse.

2025-09-01T00:15:30+00:00 ― 7 leggere min

Suono Progressi nelle tecniche di ancoraggio testo-audio

Nuovi metodi migliorano il collegamento tra descrizioni testuali e eventi sonori.

2025-08-31T16:09:40+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato Rilevazione della Direzione del Suono nei Robot Mobili

Metodi innovativi migliorano il modo in cui i robot elaborano la direzione del suono mentre sono in movimento.

2025-08-31T14:32:30+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Sviluppi nella tecnologia del beamforming

Scopri il beamforming a valori reali e i suoi vantaggi per le array di microfoni.

2025-08-31T12:06:45+00:00 ― 6 leggere min

Suono Un nuovo modello per la generazione di musica con l'IA

MusicAOG semplifica la creazione e la comprensione della musica tramite un'innovativa rappresentazione grafica.

2025-08-31T08:52:25+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progettare sistemi MIMO efficaci con array sferici

Un nuovo framework per combinare array di microfoni e altoparlanti sferici negli studi sul suono.

2025-08-31T07:15:15+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Progettare Sistemi Uditivi Efficaci per Robot Umani

Un nuovo framework per migliorare il rilevamento dei suoni nei robot umanoidi attraverso il design della matrice di microfoni.

2025-08-31T06:26:40+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Migliorare l'acustica della stanza con sistemi MIMO

Scopri come i sistemi MIMO migliorano l'analisi del suono in diversi ambienti.

2025-08-31T02:23:45+00:00 ― 7 leggere min

Informatica - Suono