Shinji Watanabe

Elaborazione dell'audio e del parlato VoxtLM: Un Approccio Unificato a Voce e Testo

VoxtLM combina riconoscimento vocale, sintesi, generazione di testo e continuazione in un unico modello.

2025-09-13T11:02:45+00:00 ― 4 leggere min

Elaborazione dell'audio e del parlato Presentiamo AV-SUPERB: un nuovo punto di riferimento per i modelli audio-visivi

AV-SUPERB valuta modelli audio e visivi su vari task per migliorare le prestazioni.

2025-09-08T22:32:35+00:00 ― 6 leggere min

Calcolo e linguaggio Progressi nella traduzione simultanea del parlato

Migliorare le traduzioni in tempo reale con metodi innovativi e politiche intelligenti.

2025-09-07T17:23:35+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Migliorare il riconoscimento vocale con nuove tecniche

Uno sguardo ai progressi nel riconoscimento vocale per aumentare velocità e precisione.

2025-09-03T21:05:05+00:00 ― 5 leggere min

Calcolo e linguaggio Avanzamenti nella traduzione orale attraverso il contesto

Nuovi metodi migliorano la traduzione del parlato concentrandosi sulle informazioni contestuali.

2025-09-02T22:24:45+00:00 ― 5 leggere min

Suono Avanzando la tecnologia vocale con dati di code-switching

Un nuovo metodo migliora il riconoscimento vocale per gli utenti che alternano tra lingue.

2025-09-02T21:36:10+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Un Approccio Universale al Miglioramento del Parlato

Questa ricerca presenta un modello per migliorare la chiarezza del discorso in diverse condizioni.

2025-09-02T02:10:10+00:00 ― 5 leggere min

Suono L'Ascesa dei Sottotitoli Audio Automatici

Esplorando i progressi nella didascalia audio automatica e il suo impatto sull'accessibilità.

2025-09-02T01:21:35+00:00 ― 5 leggere min

Calcolo e linguaggio Documentare le lingue in pericolo con IGT

Un nuovo metodo aiuta a preservare le lingue a rischio attraverso una documentazione dettagliata.

2025-08-27T17:35:42+00:00 ― 8 leggere min

Elaborazione dell'audio e del parlato Valutare i modelli di elaborazione del parlato con SUPERB

Un nuovo framework per valutare i modelli di base nei compiti di parlato.

2025-08-11T09:31:05+00:00 ― 8 leggere min

Elettroni fortemente correlati Stati Magnetici nei Quasicristalli Icosaedrici

Esplorando stati di riccio e anti-riccio in materiali magnetici unici.

2025-08-03T10:24:48+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Ridurre il rumore di fondo per un discorso più chiaro

Un nuovo sistema migliora la chiarezza del parlato in ambienti con più persone che parlano.

2025-08-02T14:10:50+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Introducendo il Modello 4D nel Riconoscimento Vocale

Un nuovo modello migliora il riconoscimento vocale usando più metodi di decodifica.

2025-08-01T01:44:35+00:00 ― 7 leggere min

Calcolo e linguaggio Progressi nella tecnologia di riconoscimento automatico del parlato

Nuovi metodi migliorano l'accuratezza e l'efficienza nei sistemi di riconoscimento vocale.

2025-07-22T03:41:05+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato SynesLM: Avanzando la tecnologia audio-visiva del parlato

Un nuovo modello integra dati audio e visivi per il riconoscimento vocale e la traduzione.

2025-07-06T20:04:15+00:00 ― 6 leggere min

Calcolo e linguaggio Traduzione in tempo reale: Colmare il divario linguistico

Questo sistema traduce il discorso in inglese in testo tedesco instantaneamente per una comunicazione senza problemi.

2025-06-27T20:53:06+00:00 ― 6 leggere min

Immunologia Varianti del COVID-19 e risposte ai vaccini: cosa sappiamo

Nuove varianti di COVID-19 mettono alla prova i vaccini attuali e sottolineano l'importanza di continuare la ricerca.

2025-06-15T20:20:03+00:00 ― 5 leggere min

Suono ESPnet-EZ: Semplificare lo Sviluppo di Modelli Vocali

Uno strumento facile da usare per perfezionare i modelli di voce senza codice complesso.

2025-06-11T15:12:30+00:00 ― 7 leggere min

Calcolo e linguaggio Avanzamenti nel Riconoscimento Vocale con LLMs

Esplorando la sfida GenSEC per migliorare l'accuratezza della trascrizione vocale.

2025-06-10T18:57:55+00:00 ― 5 leggere min

Calcolo e linguaggio Sviluppi nei sistemi di traduzione vocale multilingue

Nuovi metodi migliorano l'accuratezza e l'efficienza della traduzione per più lingue.

2025-06-10T16:14:30+00:00 ― 6 leggere min

Calcolo e linguaggio Innovazioni nella Tecnologia di Sintesi Vocale: Allineamento delle Preferenze

Scopri come l'allineamento delle preferenze migliora i sistemi di sintesi vocale per un'esperienza utente migliore.

2025-06-10T06:53:36+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Avanzamenti nel riconoscimento vocale usando i-vettori

Uno studio mostra che i i-vettori possono competere con modelli complessi nel riconoscimento vocale.

2025-06-10T06:49:10+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Scelte di design che influenzano le prestazioni del modello di parola

Uno studio su come le scelte di design influenzano i modelli di linguaggio.

2025-06-10T06:00:35+00:00 ― 7 leggere min

Elaborazione dell'audio e del parlato EVA: Una Nuova Era nel Riconoscimento Vocale Audiovisivo

EVA unisce segnali audio e visivi per una migliore precisione nel riconoscimento vocale.

2025-06-07T22:08:20+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Valutare i codec audio neurali: intuizioni dalla sfida Codec-SUPERB

Uno sguardo ai risultati della sfida Codec-SUPERB e ai metodi di misurazione delle performance del codec.

2025-06-05T06:58:50+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Progressi nei Codec Neurali con ESPnet-Codec

ESPnet-Codec migliora l'addestramento e la valutazione dei codec neurali per audio e parlato.

2025-06-03T03:09:30+00:00 ― 7 leggere min

Suono Progressi nel Riconoscimento Vocale Automatico

Nuovi metodi migliorano il modo in cui le macchine riconoscono il linguaggio parlato.

2025-04-20T10:37:12+00:00 ― 8 leggere min

Suono Incontra VERSA: Il tuo compagno per la valutazione audio

VERSA valuta bene la qualità del parlato, dell'audio e della musica.

2025-01-28T09:33:18+00:00 ― 9 leggere min

Elaborazione dell'audio e del parlato Riconoscimento Vocale Audiovisivo: Una Nuova Frontiera

Scopri come AV-ASR combina audio e immagini per migliorare il riconoscimento vocale.

2025-01-24T21:39:36+00:00 ― 6 leggere min