離散音声トークンベンチマー離散音声トークンベンチマーク。音声タスクにおける音声トークンの性能評価サウンド音声タスクのための離散オーディオトークンの評価新しいベンチマークツールが、さまざまな音声処理タスクのために離散音声トークンを評価するよ。2025-07-28T04:37:30+00:00 ― 1 分で読む
言語モデルでASRを強化す言語モデルでASRを強化する幅に減らせるようになったよ。新しい方法でLLMを使って転写エラーを大計算と言語言語モデルを使って自動音声認識を改善する新しい方法で、言語モデルを使ってASRの精度がアップして、より良い文字起こしができるようになったよ。2025-06-21T20:33:15+00:00 ― 1 分で読む