コンピューターサイエンス - サウンド

RSS

音声・音声処理 HiFTNet: テキスト読み上げ技術の進化

HiFTNetは、効率的な革新技術を使って、より速く高品質な音声合成を提供してるよ。

2025-09-09T02:35:30+00:00 ― 1 分で読む

サウンド顔画像を使った音声変換技術の進展

顔の特徴を使って声を変える新しい方法がいろんな用途で使えるようになったよ。

2025-09-09T01:46:55+00:00 ― 1 分で読む

音声・音声処理 AV-SUPERBを紹介するよ：音声・映像モデルの新しいベンチマークだ！

AV-SUPERBは、より良いパフォーマンスのためにさまざまなタスクで音声と視覚のモデルを評価するよ。

2025-09-08T22:32:35+00:00 ― 1 分で読む

サウンドセマンティック情報を使ったスピーカーのダイアライゼーションの改善

新しいアプローチが、セマンティックデータをプロセスに組み込むことでスピーカーダイアリゼーションを強化してる。

2025-09-08T20:06:50+00:00 ― 1 分で読む

サウンド一貫性蒸留を使った高速テキストから音声生成

新しい方法でテキストからオーディオ生成のスピードと効率がアップしたよ。

2025-09-08T18:29:40+00:00 ― 1 分で読む

音声・音声処理音声感情認識の進展：多言語アプローチ

研究によると、言語を超えてスピーチから感情を認識する精度が向上しているらしいよ。

2025-09-08T16:03:55+00:00 ― 1 分で読む

サウンドテスト時のトレーニングで音声認識を改善する

TTTが分布の変化に適応することで、音声認識がどう向上するかを探ってみよう。

2025-09-08T14:26:45+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識音源定位技術の進展

音声と映像データを使って音源の特定をもっと良くする方法。

2025-09-08T12:49:35+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識サウンドマッピング: サウンドスケープ分析への新しいアプローチ

高度な技術を使って、さまざまな環境で音を可視化したり予測したりする方法。

2025-09-08T11:12:25+00:00 ― 0 分で読む

計算と言語話し言葉の識別技術の進展

新しい方法が音声とメタデータを組み合わせて、言語認識を向上させる。

2025-09-08T07:09:30+00:00 ― 1 分で読む

サウンド新しい音声認識システムがスーフィングの脅威に挑む

音声認識のセキュリティを強化するために、音声プレゼンテーション攻撃を検出するシステムが設計されてるんだ。

2025-09-08T06:20:55+00:00 ― 1 分で読む

音声・音声処理リソースが少ない言語のためのWhisperの改善

ベトナム語や他のリソースが少ない言語のために、Whisperの音声認識を強化中。

2025-09-08T03:55:10+00:00 ― 1 分で読む

サウンドテキストベースの音声編集の進歩

FluentEditorは自然な流れと一貫性に重点を置いて、音声編集を改善するよ。

2025-09-07T20:37:55+00:00 ― 1 分で読む

計算と言語同時スピーチ翻訳の新しい方法

高度なセグメンテーション技術を使ってリアルタイム翻訳を改善する。

2025-09-07T18:12:10+00:00 ― 1 分で読む

計算と言語同時スピーチ翻訳の進展

革新的な方法やスマートな政策を通じてリアルタイム翻訳を改善する。

2025-09-07T17:23:35+00:00 ― 1 分で読む

音声・音声処理チュニジアアラビア語の自動音声認識を進める

チュニジアアラビア語とコードスイッチングのためのASRシステムを改善する取り組み。

2025-09-07T16:35:00+00:00 ― 1 分で読む

サウンド音楽生成のパーソナライズ：新しいアプローチ

革新的な方法は、音楽生成をユーザーの好みに合わせることを目指している。

2025-09-07T15:46:25+00:00 ― 1 分で読む

音声・音声処理スピーチセパレーションのためのSPGMモデルを紹介するよ

新しいモデルがスピーチセパレーションの効率とパフォーマンスを向上させた。

2025-09-07T10:54:55+00:00 ― 1 分で読む

音声・音声処理新しいモデルが音質評価を向上させたよ。

新しいアプローチでは、さまざまな環境で複数のマイクを使って音質を評価するんだ。

2025-09-07T08:29:10+00:00 ― 1 分で読む

音声・音声処理音声分離技術の進歩

新しい方法で、異なる周波数の音の分離が改善される。

2025-09-07T06:03:25+00:00 ― 1 分で読む

音声・音声処理音声コミュニケーションを音響エコーキャンセリングで改善する

通話品質を向上させるために、エコーキャンセリングの進展を探ろう。

2025-09-07T05:14:50+00:00 ― 1 分で読む

サウンドマルチインストゥルメント音楽合成の進歩

新しい方法が演奏コンテキストを追加することで音楽生成を改善する。

2025-09-07T01:11:55+00:00 ― 1 分で読む

サウンド革新的な手法がテキストデータを使って音声キャプションを変革する

新しいアプローチがテキストだけを使ってオーディオキャプションを生成し、データ効率を向上させるんだ。

2025-09-07T00:23:20+00:00 ― 1 分で読む

サウンド音楽をつなぐ：音声と楽譜の検索

音声録音を楽譜に合わせる際の課題や革新を探る。

2025-09-06T21:57:35+00:00 ― 1 分で読む

サウンド自己教師あり学習で音楽検索を進化させる

新しいアプローチは、音声と楽譜をつなげるために自己教師あり学習を活用している。

2025-09-06T21:09:00+00:00 ― 0 分で読む

サウンド音声と楽譜を再帰ネットワークでリンクする

新しい方法で音声と楽譜のマッチングが良くなるよ。

2025-09-06T19:31:50+00:00 ― 1 分で読む

音声・音声処理 K-meansクラスタリングで音声データセットを改善する

オーディオデータを最適化してモデルのトレーニングを良くするためにk-meansクラスタリングを使う。

2025-09-06T15:28:55+00:00 ― 1 分で読む

音声・音声処理音声認識を音声増強技術で向上させる

研究によると、音声増強がリソースの少ない言語での音声認識を向上させることができるんだって。

2025-09-06T09:48:50+00:00 ― 1 分で読む

音声・音声処理適応マスキングでマルチリンガル自動音声認識を進める

新しいアプローチで、多言語ASRモデルの効率が向上して、適応マスキング技術が統合されたよ。

2025-09-06T09:00:15+00:00 ― 1 分で読む

サウンドディープフェイク音声を使って、より良い文字起こしシステムを作る

珍しい言語の転写モデルを向上させるために、ディープフェイク音声を調査中。

2025-09-06T07:23:05+00:00 ― 1 分で読む

機械学習ネガティブ例の選択を通じて弱ラベル学習を改善する

新しい戦略は、関連するネガティブ例を選ぶことによって弱ラベル学習を強化する。

2025-09-06T04:57:20+00:00 ― 1 分で読む

サウンド音声モデルの新しいウォーターマーク技術

所有権保護のために拡散モデルで作成された音声にウォーターマークを付ける新しい方法。

2025-09-06T04:08:45+00:00 ― 1 分で読む

音声・音声処理メモリーネットワークで音声認識を改善する

新しい技術がASRシステムを強化して、長いスピーチの認識がもっと良くなるよ。

2025-09-06T03:20:10+00:00 ― 1 分で読む

音声・音声処理キーワードスポッティングシステムの進展

新しい技術が、攻撃に対する音声操作デバイスの精度を向上させることを目指している。

2025-09-06T01:43:00+00:00 ― 1 分で読む

音声・音声処理 DurIAN-E: テキスト音声変換技術の進化

DurIAN-Eは合成音声の表現力と自然な流れを改善するよ。

2025-09-06T00:54:25+00:00 ― 1 分で読む

音声・音声処理音声感情認識技術の進展

SERが感情検出を通じて人間と機械のインタラクションをどう向上させるかを発見しよう。

2025-09-06T00:05:50+00:00 ― 1 分で読む

音声・音声処理音声認識の効率的なモデル選択

音声特徴に基づいて最適なASRモデルを選ぶ方法。

2025-09-05T23:17:15+00:00 ― 1 分で読む

音声・音声処理残響除去技術でスピーチの明瞭度を向上させる

ノイズがうるさい環境でスピーチ認識を向上させるデレバーバレーションの学び方。

2025-09-05T12:45:40+00:00 ― 1 分で読む

サウンド Coco-Nutの紹介: TTS用の包括的な音声データベース

Coco-Nutは、進んだテキスト音声合成アプリのために多様な日本語の音声サンプルを提供してるよ。

2025-09-05T11:57:05+00:00 ― 1 分で読む

音声・音声処理注意モデルを使った部屋の容積推定の新しい方法

この研究では、音声録音から部屋の体積を推定するための注意ベースのモデルを紹介してるよ。

2025-09-05T11:08:30+00:00 ― 1 分で読む