Haibin Wu

AV-SUPERBは、より良いパフォーマンスのためにさまざまなタスクで音声と視覚のモデルを評価するよ。

2025-09-08T22:32:35+00:00 ― 1 分で読む

EMO-SUPERBプロジェクトは、技術の向上とコミュニティの協力を通じてスピーチ感情認識を強化するんだ。

2025-08-23T00:52:20+00:00 ― 1 分で読む

さまざまなアプリケーションでオーディオコーデックのパフォーマンスを評価する新しいシステム。

2025-08-22T23:15:10+00:00 ― 1 分で読む

音声タスクにおける基盤モデルを評価するための新しいフレームワーク。

2025-08-11T09:31:05+00:00 ― 1 分で読む

音声データの中でコーデックが感情のトーンをどう保持するかを調べてる。

2025-07-12T06:26:10+00:00 ― 1 分で読む

この記事では、自己教師あり学習を使った音声モデルの効率的なトレーニング方法について話してるよ。

2025-06-16T15:02:50+00:00 ― 1 分で読む

MCMambaモデルは、騒がしい環境での音声品質を空間的およびスペクトル情報を使って改善するんだ。

2025-06-09T21:54:45+00:00 ― 1 分で読む

この研究は、騒がしい条件下での音声品質を向上させるための低遅延手法を評価してるよ。

2025-06-09T20:17:35+00:00 ― 1 分で読む

Codec-SUPERBチャレンジの結果とコーデックのパフォーマンス指標を見てみよう。

2025-06-05T06:58:50+00:00 ― 1 分で読む

ESPnet-Codecは、音声やオーディオのニューラルコーデックのトレーニングと評価を強化するよ。

2025-06-03T03:09:30+00:00 ― 1 分で読む

新しい方法がAIシステムの注意負荷の効率を改善する。

2025-06-01T21:34:30+00:00 ― 1 分で読む

VERSAはスピーチ、オーディオ、音楽の品質を効果的に評価するよ。

2025-01-28T09:33:18+00:00 ― 1 分で読む