新しいアプローチで、多言語ASRモデルの効率が向上して、適応マスキング技術が統合されたよ。
― 1 分で読む
最先端の科学をわかりやすく解説
新しいアプローチで、多言語ASRモデルの効率が向上して、適応マスキング技術が統合されたよ。
― 1 分で読む
珍しい言語の転写モデルを向上させるために、ディープフェイク音声を調査中。
― 1 分で読む
新しい戦略は、関連するネガティブ例を選ぶことによって弱ラベル学習を強化する。
― 1 分で読む
所有権保護のために拡散モデルで作成された音声にウォーターマークを付ける新しい方法。
― 1 分で読む
新しい技術がASRシステムを強化して、長いスピーチの認識がもっと良くなるよ。
― 1 分で読む
新しい技術が、攻撃に対する音声操作デバイスの精度を向上させることを目指している。
― 1 分で読む
DurIAN-Eは合成音声の表現力と自然な流れを改善するよ。
― 1 分で読む
SERが感情検出を通じて人間と機械のインタラクションをどう向上させるかを発見しよう。
― 1 分で読む
音声特徴に基づいて最適なASRモデルを選ぶ方法。
― 1 分で読む
ノイズがうるさい環境でスピーチ認識を向上させるデレバーバレーションの学び方。
― 1 分で読む
Coco-Nutは、進んだテキスト音声合成アプリのために多様な日本語の音声サンプルを提供してるよ。
― 1 分で読む
この研究では、音声録音から部屋の体積を推定するための注意ベースのモデルを紹介してるよ。
― 1 分で読む
ASCAモデルは、小規模データセットの音声分類精度を向上させる。
― 1 分で読む
MySTは子供たちの科学学習をバーチャルチュータリングで向上させることを目指しているよ。
― 1 分で読む
研究が4チャンネルと2チャンネルのオーディオフォーマットの音の定位精度を比較した。
― 1 分で読む
M2MeT 2.0とその会議トランスクリプションへの影響についての考察。
― 1 分で読む
新しい音声処理方法が、スピーカーの匿名性を高めつつ、話し方の明瞭さを保つ。
― 1 分で読む
この研究はMRIの舌データを実際の音声オーディオに変換するんだ。
― 1 分で読む
この研究は、モデル圧縮が騒がしい環境での音声認識にどのように影響するかを調べている。
― 1 分で読む
オンラインアクティブラーニングが音の認識効率をどう向上させるか探ってみよう。
― 1 分で読む
新しいモデルが、音声と音の理解を同時に改善するんだ。
― 0 分で読む
複数のコミュニケーション方法を使って、セラピーセッションでクライアントの言語を分類するシステム。
― 1 分で読む
新しい技術が構音障害の検出と重症度の分類を改善する。
― 1 分で読む
新しい方法が声の問題を早期に発見するのに役立つ声帯源の特徴を使ってるよ。
― 1 分で読む
さまざまなアクセントをよりよく認識して適応できるようにスピーチモデルを強化する。
― 1 分で読む
DCLSは、トレーニング中にカーネルの位置を学習することで音声分類の性能を向上させる。
― 1 分で読む
新しい方法が音声・映像データの機械学習を強化する。
― 1 分で読む
騒がしい環境でのスピーチ抽出をもっと良くする新しいモデルを紹介します。
― 1 分で読む
新しい方法が低ランク適応を使って音声認識の効率を高めてるんだ。
― 1 分で読む
オーディオ、ビデオ、テキストを組み合わせて、メンタルヘルスの評価をより良くする。
― 0 分で読む
音声認識の進歩を見て、スピードと精度をアップさせる。
― 1 分で読む
高度な音声認識技術を使って医者と患者のコミュニケーションを改善する。
― 1 分で読む
音声制御技術のプライバシーとセキュリティの脅威を探る。
― 1 分で読む
Synthiaのメロディーは、研究者がさまざまなデータに対して音声モデルのテストをするのを手助けしてるよ。
― 1 分で読む
研究は、セグメント化されていない音声のためのASRシステムの改善に焦点を当てている。
― 1 分で読む
研究は、さまざまなメディアでの人間の声のためのシンセサイザーの最適化に焦点を当てている。
― 1 分で読む
新しい方法がセッションのばらつきをうまく管理することで、スピーカーバリデーションを改善するよ。
― 1 分で読む
LLMは音声認識システムの精度とエラー修正を向上させるんだ。
― 1 分で読む
新しい方法が、ラベルなしで音の認識と音源の特定を向上させる。
― 1 分で読む
言語モデルを使ってASR精度を向上させる新しいベンチマーク。
― 1 分で読む