Xie Chen

スピーチデータを選ぶ新しい方法は、ラベリングを最小限に抑えつつ、認識精度を向上させる。

2025-09-20T13:53:50+00:00 ― 1 分で読む

ELLA-Vはテキスト読み上げの品質とコントロールを向上させて、以前のモデルを超えたよ。

2025-08-30T01:17:40+00:00 ― 1 分で読む

新しいモデルが機械の空間音声の理解を向上させる。

2025-08-26T15:30:45+00:00 ― 1 分で読む

AniTalkerは、ポートレートと音声を使ってリアルなアニメーションを作り、微妙な表情の動きを捉えるんだ。

2025-08-13T18:14:24+00:00 ― 1 分で読む

GigaSpeech 2は、音声認識を改善するためのリソースの少ない言語向けの膨大なデータセットを提供してるよ。

2025-07-29T02:29:15+00:00 ― 1 分で読む

音響BPEは、TTSシステムにおける音声の明瞭さと質を向上させるよ。

2025-07-22T08:32:35+00:00 ― 1 分で読む

物理学や材料科学におけるトポロジー的欠陥の重要性を探る。

2025-07-15T04:02:54+00:00 ― 1 分で読む

新しい方法で、いろんなタスクでスピーチモデルのパフォーマンスが向上したよ。

2025-06-21T02:44:25+00:00 ― 1 分で読む

VQTalkerは、リアルなトーキングアバターを複数の言語で作成し、デジタルなやり取りをより楽しくするよ。

2025-03-09T22:14:42+00:00 ― 1 分で読む