電気工学・システム科学 - 音声・音声処理

RSS

音声・音声処理適応マスキングでマルチリンガル自動音声認識を進める

新しいアプローチで、多言語ASRモデルの効率が向上して、適応マスキング技術が統合されたよ。

2025-09-06T09:00:15+00:00 ― 1 分で読む

サウンドディープフェイク音声を使って、より良い文字起こしシステムを作る

珍しい言語の転写モデルを向上させるために、ディープフェイク音声を調査中。

2025-09-06T07:23:05+00:00 ― 1 分で読む

機械学習ネガティブ例の選択を通じて弱ラベル学習を改善する

新しい戦略は、関連するネガティブ例を選ぶことによって弱ラベル学習を強化する。

2025-09-06T04:57:20+00:00 ― 1 分で読む

サウンド音声モデルの新しいウォーターマーク技術

所有権保護のために拡散モデルで作成された音声にウォーターマークを付ける新しい方法。

2025-09-06T04:08:45+00:00 ― 1 分で読む

音声・音声処理メモリーネットワークで音声認識を改善する

新しい技術がASRシステムを強化して、長いスピーチの認識がもっと良くなるよ。

2025-09-06T03:20:10+00:00 ― 1 分で読む

音声・音声処理キーワードスポッティングシステムの進展

新しい技術が、攻撃に対する音声操作デバイスの精度を向上させることを目指している。

2025-09-06T01:43:00+00:00 ― 1 分で読む

音声・音声処理 DurIAN-E: テキスト音声変換技術の進化

DurIAN-Eは合成音声の表現力と自然な流れを改善するよ。

2025-09-06T00:54:25+00:00 ― 1 分で読む

音声・音声処理音声感情認識技術の進展

SERが感情検出を通じて人間と機械のインタラクションをどう向上させるかを発見しよう。

2025-09-06T00:05:50+00:00 ― 1 分で読む

音声・音声処理音声認識の効率的なモデル選択

音声特徴に基づいて最適なASRモデルを選ぶ方法。

2025-09-05T23:17:15+00:00 ― 1 分で読む

音声・音声処理残響除去技術でスピーチの明瞭度を向上させる

ノイズがうるさい環境でスピーチ認識を向上させるデレバーバレーションの学び方。

2025-09-05T12:45:40+00:00 ― 1 分で読む

サウンド Coco-Nutの紹介: TTS用の包括的な音声データベース

Coco-Nutは、進んだテキスト音声合成アプリのために多様な日本語の音声サンプルを提供してるよ。

2025-09-05T11:57:05+00:00 ― 1 分で読む

音声・音声処理注意モデルを使った部屋の容積推定の新しい方法

この研究では、音声録音から部屋の体積を推定するための注意ベースのモデルを紹介してるよ。

2025-09-05T11:08:30+00:00 ― 1 分で読む

サウンド ASCAの紹介：音声分類の新しいアプローチ

ASCAモデルは、小規模データセットの音声分類精度を向上させる。

2025-09-05T10:19:55+00:00 ― 1 分で読む

計算と言語私のサイエンスチュータープロジェクト: 学び方の新しいスタイル

MySTは子供たちの科学学習をバーチャルチュータリングで向上させることを目指しているよ。

2025-09-05T09:31:20+00:00 ― 1 分で読む

サウンド異なるオーディオセットアップでの音イベントローカリゼーションの評価

研究が4チャンネルと2チャンネルのオーディオフォーマットの音の定位精度を比較した。

2025-09-05T08:42:45+00:00 ― 1 分で読む

サウンド会議の文字起こし技術の進歩

M2MeT 2.0とその会議トランスクリプションへの影響についての考察。

2025-09-05T03:51:15+00:00 ― 1 分で読む

音声・音声処理ニューラルオーディオコーデックを使ったスピーカーの匿名化の進展

新しい音声処理方法が、スピーカーの匿名性を高めつつ、話し方の明瞭さを保つ。

2025-09-05T01:25:30+00:00 ― 1 分で読む

サウンド舌の動きを音声に変える

この研究はMRIの舌データを実際の音声オーディオに変換するんだ。

2025-09-04T22:11:10+00:00 ― 1 分で読む

音声・音声処理音声認識モデルの進展と課題

この研究は、モデル圧縮が騒がしい環境での音声認識にどのように影響するかを調べている。

2025-09-04T19:45:25+00:00 ― 1 分で読む

音声・音声処理 OALを使った音イベント検出の進展

オンラインアクティブラーニングが音の認識効率をどう向上させるか探ってみよう。

2025-09-04T18:56:50+00:00 ― 1 分で読む

サウンド音声認識モデルの進展

新しいモデルが、音声と音の理解を同時に改善するんだ。

2025-09-04T18:08:15+00:00 ― 0 分で読む

機械学習動機付け面接の自動分類

複数のコミュニケーション方法を使って、セラピーセッションでクライアントの言語を分類するシステム。

2025-09-04T16:31:05+00:00 ― 1 分で読む

音声・音声処理機械学習を使った構音障害検出の進展

新しい技術が構音障害の検出と重症度の分類を改善する。

2025-09-04T11:39:35+00:00 ― 1 分で読む

音声・音声処理声の病理検出の進歩

新しい方法が声の問題を早期に発見するのに役立つ声帯源の特徴を使ってるよ。

2025-09-04T10:02:25+00:00 ― 1 分で読む

音声・音声処理多様なアクセントの音声認識を改善する

さまざまなアクセントをよりよく認識して適応できるようにスピーチモデルを強化する。

2025-09-04T08:25:15+00:00 ― 1 分で読む

サウンド DCLSを使った音声分類の進展

DCLSは、トレーニング中にカーネルの位置を学習することで音声分類の性能を向上させる。

2025-09-04T07:36:40+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識スピード共同拡張で音声・映像学習を向上させる

新しい方法が音声・映像データの機械学習を強化する。

2025-09-04T05:59:30+00:00 ― 1 分で読む

音声・音声処理音声抽出技術の進歩

騒がしい環境でのスピーチ抽出をもっと良くする新しいモデルを紹介します。

2025-09-04T02:45:10+00:00 ― 1 分で読む

計算と言語低階適応を使って音声認識を改善する

新しい方法が低ランク適応を使って音声認識の効率を高めてるんだ。

2025-09-04T00:19:25+00:00 ― 1 分で読む

信号処理統合失調症の症状を特定する新しいアプローチ

オーディオ、ビデオ、テキストを組み合わせて、メンタルヘルスの評価をより良くする。

2025-09-03T22:42:15+00:00 ― 0 分で読む

音声・音声処理新しい技術で音声認識を改善する

音声認識の進歩を見て、スピードと精度をアップさせる。

2025-09-03T21:05:05+00:00 ― 1 分で読む

計算と言語医療における言語のギャップを埋める

高度な音声認識技術を使って医者と患者のコミュニケーションを改善する。

2025-09-03T18:39:20+00:00 ― 1 分で読む

暗号とセキュリティ音声操作デバイスのプライバシーリスク

音声制御技術のプライバシーとセキュリティの脅威を探る。

2025-09-03T16:13:35+00:00 ― 1 分で読む

サウンドシンシアのメロディー：音声研究のための新しいツール

Synthiaのメロディーは、研究者がさまざまなデータに対して音声モデルのテストをするのを手助けしてるよ。

2025-09-03T14:36:25+00:00 ― 1 分で読む

計算と言語長文の自動音声認識の課題に対処する

研究は、セグメント化されていない音声のためのASRシステムの改善に焦点を当てている。

2025-09-03T13:47:50+00:00 ― 1 分で読む

音声・音声処理リアルな音声のためのボイスシンセシスの進化

研究は、さまざまなメディアでの人間の声のためのシンセサイザーの最適化に焦点を当てている。

2025-09-03T09:44:55+00:00 ― 1 分で読む

音声・音声処理話者認証の進展：セッションの変動に対処する

新しい方法がセッションのばらつきをうまく管理することで、スピーカーバリデーションを改善するよ。

2025-09-03T08:56:20+00:00 ― 1 分で読む

計算と言語大規模言語モデルで音声認識を改善する

LLMは音声認識システムの精度とエラー修正を向上させるんだ。

2025-09-03T06:30:35+00:00 ― 1 分で読む

音声・音声処理 MC-SimCLR: サウンド学習と位置認識の進化

新しい方法が、ラベルなしで音の認識と音源の特定を向上させる。

2025-09-03T00:50:30+00:00 ― 1 分で読む

計算と言語ハイポラダイス：自動音声認識の精度向上

言語モデルを使ってASR精度を向上させる新しいベンチマーク。

2025-09-02T23:13:20+00:00 ― 1 分で読む