Ziyang Ma

新しい方法でテキストの説明を音のイベントにリンクさせるのがもっと簡単になったよ。

2025-08-31T16:09:40+00:00 ― 1 分で読む

ELLA-Vはテキスト読み上げの品質とコントロールを向上させて、以前のモデルを超えたよ。

2025-08-30T01:17:40+00:00 ― 1 分で読む

新しいモデルが機械の空間音声の理解を向上させる。

2025-08-26T15:30:45+00:00 ― 1 分で読む

MuPTはAIを使って効果的に音楽を生成するためにABC表記を利用してるよ。

2025-08-12T09:00:00+00:00 ― 1 分で読む

MAP-NeoはAI言語モデルの透明性とパフォーマンスを目指してるよ。

2025-08-04T21:04:18+00:00 ― 1 分で読む

GigaSpeech 2は、音声認識を改善するためのリソースの少ない言語向けの膨大なデータセットを提供してるよ。

2025-07-29T02:29:15+00:00 ― 1 分で読む

新しい方法で、いろんなタスクでスピーチモデルのパフォーマンスが向上したよ。

2025-06-21T02:44:25+00:00 ― 1 分で読む

VQTalkerは、リアルなトーキングアバターを複数の言語で作成し、デジタルなやり取りをより楽しくするよ。

2025-03-09T22:14:42+00:00 ― 1 分で読む