コンピューターサイエンス - サウンド

RSS

音声・音声処理 TTSシステムにおけるスピーチの多様性向上

新しい方法がテキスト読み上げの自然さとバリエーションを向上させるよ。

2025-11-01T13:11:30+00:00 ― 1 分で読む

音声・音声処理 Treffアダプターを使った音声分類の進展

Treffアダプターは、ラベル付きデータが限られた状態で音声分類を改善する。

2025-11-01T12:22:55+00:00 ― 1 分で読む

機械学習マルチタスク自己教師あり学習の進展

新しい方法が音声タスクでモデルの柔軟性とパフォーマンスを向上させる。

2025-11-01T08:20:00+00:00 ― 1 分で読む

サウンド E-PANNsを使った効率的なオーディオタグ付け

E-PANNsが音声認識の効率をどう向上させるかを見つけよう。

2025-11-01T04:17:05+00:00 ― 1 分で読む

計算と言語音声処理を通じた方言分析

この研究は音声録音を使って方言を分析し、その類似点を明らかにしてるよ。

2025-11-01T02:39:55+00:00 ― 0 分で読む

サウンド音声分類技術の進展

新しい音を効率的に学ぶことで、音声分類を強化する新しい方法が登場した。

2025-10-31T22:37:00+00:00 ― 1 分で読む

サウンドテキスト音声変換適応技術の進展

新しい方法で、最小限のデータでTTSの適応が改善される。

2025-10-31T21:48:25+00:00 ― 1 分で読む

計算と言語音声認識システムにおける説明可能なAIの理解

自動音声認識における説明可能なAI手法の概要。

2025-10-31T20:11:15+00:00 ― 1 分で読む

サウンド MWAFMモデルで音声質問応答を進化させる

新しいモデルが機械が音声質問を理解して応答する方法を改善した。

2025-10-31T18:34:05+00:00 ― 1 分で読む

音声・音声処理テキスト読み上げシステムにおけるターンテイキングの評価

研究でTTS技術のターンテイキングを改善する必要があるって指摘されてるよ。

2025-10-31T17:45:30+00:00 ― 1 分で読む

音声・音声処理合成音声を最適化して、ASRトレーニングを向上させる

新しい方法が合成音声の選択を改善して、ASRシステムの精度を向上させるよ。

2025-10-31T08:51:05+00:00 ― 1 分で読む

音声・音声処理新しい技術でスピーチ障害の調整を改善する

新しい方法が、不流暢な話し言葉をテキストと効率的に合わせるよ。

2025-10-31T08:02:30+00:00 ― 1 分で読む

サウンドサイレントスピーチインターフェースの進展

新しい技術でサイレントスピーチ認識システムを改善する。

2025-10-31T07:13:55+00:00 ― 1 分で読む

計算と言語コンテキストバイアスでASR精度を上げる

新しい方法が文脈を使って珍しい単語の自動音声認識を向上させる。

2025-10-31T02:22:25+00:00 ― 1 分で読む

サウンド弱い監視下でのキーワードスポッティングの進展

雑音の多い環境で弱い監視を使ってキーワードスポッティングモデルをトレーニングする新しい方法。

2025-10-31T01:33:50+00:00 ― 1 分で読む

計算と言語リソースが少ない言語のための音声翻訳の進展

マイナーな言語の音声翻訳システムを改善する方法。

2025-10-31T00:45:15+00:00 ― 1 分で読む

サウンド MERT: 音楽理解のための自己教師ありモデル

MERTは革新的な自己教師あり学習技術で音楽モデルの課題に取り組んでるよ。

2025-10-30T23:56:40+00:00 ― 1 分で読む

サウンド強化学習でRNN-Tモデルを改善する

新しいアプローチが自動音声認識におけるRNN-Tのパフォーマンスを向上させる。

2025-10-30T19:53:45+00:00 ― 1 分で読む

音声・音声処理 AVLIT: 雑音の中でのスピーチ分離を進める

AVLITモデルは、騒がしい環境でのスピーチの明瞭性を向上させるために音と映像を組み合わせてるよ。

2025-10-30T18:16:35+00:00 ― 1 分で読む

機械学習音声認識システムにおけるショートカット学習の対策

音声検出技術におけるバイアスデータの影響を調べる。

2025-10-30T17:28:00+00:00 ― 1 分で読む

サウンド複数のマイクで音声分離を改善する

新しい方法が、ラベル付きデータなしで複数のマイクを使って音声の分離を強化する。

2025-10-30T15:50:50+00:00 ― 1 分で読む

サウンド音声アンチスプーフィング技術の進展

研究がスピーカー認証モデルを改善して、より良いアイデンティティ保護を実現。

2025-10-30T15:02:15+00:00 ― 1 分で読む

計算と言語音声質問応答システムの進展

新しいモデルは、機械が音声ベースの質問にどう反応するかを改善してるよ。

2025-10-30T13:25:05+00:00 ― 1 分で読む

計算と言語スイスドイツ語の音声合成の進展

新しい方法で、標準ドイツ語のテキストからスイスドイツ語の音声合成が強化されるよ。

2025-10-30T10:59:20+00:00 ― 1 分で読む

サウンド SVVADを使った音声活動検出の進化

SVVADが音声活動検出を改善して、より良いスピーカーバリフィケーションを実現する方法を見つけよう。

2025-10-30T09:22:10+00:00 ― 1 分で読む

サウンド自動発音評価の進展

新しい方法が語学学習者の発音フィードバックを改善する。

2025-10-30T08:33:35+00:00 ― 1 分で読む

計算と言語音声認識モデルの適応性を測る

新しいフレームワークが、スピーチモデルが特定のタスクにどれだけ適応できるかを評価する。

2025-10-30T06:56:25+00:00 ― 1 分で読む

サウンド HuBERTで音声処理を進化させる

HuBERTモデルは、複数の解像度を使ってスピーチタスクを改善し、パフォーマンスを向上させるよ。

2025-10-29T22:02:00+00:00 ― 1 分で読む

音声・音声処理スピーカー識別技術の進歩

新しい技術が話者の認識と偽者の検出の精度を向上させてる。

2025-10-29T20:24:50+00:00 ― 1 分で読む

サウンドディープラーニングでバーチャルアナログオーディオエフェクトを改善する

新しいアプローチがディープラーニングを使ってバーチャルオーディオエフェクトの位相応答を向上させる。

2025-10-29T18:47:40+00:00 ― 0 分で読む

サウンド音声認識の遅延：SlothSpeechを詳しく見てみよう

スロースピーチは音声認識システムの脆弱性を暴露して、かなり遅くするんだ。

2025-10-29T17:10:30+00:00 ― 1 分で読む

サウンド UnDiff: 音声の明瞭さへの新しいアプローチ

UnDiffは革新的な音声復元技術を使って音質を向上させるよ。

2025-10-29T16:21:55+00:00 ― 1 分で読む

サウンド吃音検出技術の進歩

機械学習の新しい手法が、吃音検出の能力を向上させてるよ。

2025-10-29T14:44:45+00:00 ― 1 分で読む

サウンド EmoMix：感情的な音声合成の進化

EmoMixは、正確な強さで混ざった感情を表現するスピーチの作成を可能にするよ。

2025-10-29T13:56:10+00:00 ― 1 分で読む

サウンド MW-MAE: 音声学習への新しいアプローチ

革新的なマルチウィンドウマスク付きオートエンコーダ法で音声処理を強化しよう。

2025-10-29T11:30:25+00:00 ― 1 分で読む

サウンド視覚的手がかりで音声復元を改善する

音声と視覚データを組み合わせて、欠けたスピーチを修正する新しい方法ができたよ。

2025-10-29T10:41:50+00:00 ― 1 分で読む

計算と言語リソースが少ない言語におけるヘイトスピーチへの対処

リソースが不足してる言語の音声放送でヘイトスピーチを検出する方法を探る。

2025-10-29T09:04:40+00:00 ― 1 分で読む

音声・音声処理音を蘇らせる：音声修復のためのBABEメソッド

新しい方法が、歴史的な録音で失われた高周波を復元する。

2025-10-29T06:38:55+00:00 ― 1 分で読む

サウンド BEDRFで音のシミュレーションを進化させる

新しいモデルが仮想環境での音の回折を改善する。

2025-10-29T01:47:25+00:00 ― 1 分で読む

計算と言語文脈バイアスを使って音声認識を向上させる

コンテキストバイアスはASRシステムを強化して、専門的なタスクでの精度を向上させるんだよ。

2025-10-29T00:58:50+00:00 ― 1 分で読む