電気工学・システム科学 - 音声・音声処理

RSS

ヒューマンコンピュータインタラクションループボックス: 音楽を作る新しい方法

LoopBoxesは子供たちが簡単に協力して音楽を作れるように手助けするよ。

2025-11-03T08:55:00+00:00 ― 1 分で読む

サウンドニューラルネットワークを使った革新的なサウンド合成

ニューラルネットワークを使ってリアルな衝撃音を作る新しい方法。

2025-11-03T08:06:25+00:00 ― 1 分で読む

計算と言語非ネイティブスピーカーのための音声認識の改善

新しい技術で、ASRシステムが非ネイティブアクセントの認識がもっと良くなるよ。

2025-11-03T02:26:20+00:00 ― 1 分で読む

音声・音声処理弱教師あり学習で音声認識を進化させる

新しい方法はスピーカーのアイデンティティを活用して音声認識のパフォーマンスを向上させる。

2025-11-03T01:37:45+00:00 ― 1 分で読む

サウンドサイドカーアプローチで音声認識を改善する

新しい方法は、重なり合ったスピーチのために音声認識と話者識別を組み合わせるんだ。

2025-11-03T00:49:10+00:00 ― 1 分で読む

計算と言語 DiSegを使った同時音声翻訳の進展

新しい方法がリアルタイム翻訳の質と効率を向上させる。

2025-11-03T00:00:35+00:00 ― 1 分で読む

計算と言語アテンションメカニズムで少数ショット学習を改善する

新しいアプローチで、機械学習が少ない例とマルチモーダルデータで強化される。

2025-11-02T22:23:25+00:00 ― 1 分で読む

サウンド複数の音源を使った部屋のインパルス応答の推定

複雑な音環境での部屋の反応を推定する新しい方法。

2025-11-02T21:34:50+00:00 ― 1 分で読む

音声・音声処理音声変換技術の進展

音声変換の新しい方法が明瞭さと適応性を向上させたよ。

2025-11-02T19:57:40+00:00 ― 1 分で読む

音声・音声処理トルコ語系言語のテキスト音声変換の進展

カザフのデータを使ってあまり知られていないトルコ語系の言語のTTSシステムを作ってるんだ。

2025-11-02T18:20:30+00:00 ― 1 分で読む

サウンド MeLoDyの紹介: 速攻音楽生成が明らかに

MeLoDyは、テキストプロンプトから高品質な音楽をすぐに生成するよ。

2025-11-02T17:31:55+00:00 ― 1 分で読む

サウンド音声認識システムのセキュリティ脅威への対処

新しい方法が出てきて、音声認識を敵対的攻撃から守るようになったよ。

2025-11-02T16:43:20+00:00 ― 1 分で読む

音声・音声処理 AudioDecを紹介するよ：音声ストリーミングの新時代だ！

AudioDecは低データ使用でリアルタイムの高品質オーディオを提供してるよ。

2025-11-02T15:06:10+00:00 ― 1 分で読む

サウンド新しい方法が拡散モデルのプライバシーリスクを明らかにした

拡散モデルのトレーニングデータの露出をチェックする新しい手法。

2025-11-02T13:29:00+00:00 ― 1 分で読む

サウンド S4Mを使った音声分離の進展

新しいモデルは、騒がしい環境での声の隔離を改善する。

2025-11-02T10:14:40+00:00 ― 1 分で読む

音声・音声処理デジタルツールで磁気テープの音を再現する

この記事では、デジタル技術を使って磁気テープの音を再現する方法について話してるよ。

2025-11-02T09:26:05+00:00 ― 1 分で読む

音声・音声処理音声合成技術の進歩

新しいフレームワークが音声合成の音声生成品質を向上させたよ。

2025-11-02T06:11:45+00:00 ― 1 分で読む

音声・音声処理パーソナライズド合成音声の進歩

研究者たちが、話すのに困難がある人のためにユニークな声を再現する技術を開発した。

2025-11-01T23:43:05+00:00 ― 0 分で読む

音声・音声処理 OS-KDFT法によるスピーカー認証の改善

新しい方法で、知識蒸留とファインチューニングを組み合わせてスピーカー認証を強化するんだ。

2025-11-01T22:05:55+00:00 ― 1 分で読む

音声・音声処理 DeCoR: 音声学習の新しい方法

DeCoRは、機械が古い音を忘れずに新しい音を学ぶのを助けるんだ。

2025-11-01T21:17:20+00:00 ― 1 分で読む

サウンドリアルタイムオーディオタグ付けの進展

ストリーミングオーディオトランスフォーマーは、オーディオタグ付けシステムの速度と効率を向上させる。

2025-11-01T20:28:45+00:00 ― 1 分で読む

計算と言語音声文字起こしの方法の進展

新しい技術が音声をテキストに変換する精度と速度を向上させてるよ。

2025-11-01T16:25:50+00:00 ― 1 分で読む

サウンド構音障害のスピーチ評価：クリアさを高める新しい方法

この研究は、構音障害のある人たちがより明確にコミュニケーションできるように、改善された評価方法を紹介しているよ。

2025-11-01T15:37:15+00:00 ― 1 分で読む

サウンド音声認識の課題に対処するための異和音の言葉

新しい方法で、似たような音の名前の音声認識が向上した。

2025-11-01T14:48:40+00:00 ― 1 分で読む

音声・音声処理 TTSシステムにおけるスピーチの多様性向上

新しい方法がテキスト読み上げの自然さとバリエーションを向上させるよ。

2025-11-01T13:11:30+00:00 ― 1 分で読む

音声・音声処理 Treffアダプターを使った音声分類の進展

Treffアダプターは、ラベル付きデータが限られた状態で音声分類を改善する。

2025-11-01T12:22:55+00:00 ― 1 分で読む

機械学習マルチタスク自己教師あり学習の進展

新しい方法が音声タスクでモデルの柔軟性とパフォーマンスを向上させる。

2025-11-01T08:20:00+00:00 ― 1 分で読む

音声・音声処理スピーカー埋め込みを使った感情認識の進展

研究は、埋め込みを使ってスピーチの感情を認識する効果的な方法を強調している。

2025-11-01T07:31:25+00:00 ― 1 分で読む

サウンド E-PANNsを使った効率的なオーディオタグ付け

E-PANNsが音声認識の効率をどう向上させるかを見つけよう。

2025-11-01T04:17:05+00:00 ― 1 分で読む

計算と言語音声処理を通じた方言分析

この研究は音声録音を使って方言を分析し、その類似点を明らかにしてるよ。

2025-11-01T02:39:55+00:00 ― 0 分で読む

計算と言語離散単位を使った話し言葉理解の進展

新しい方法が、書き起こしなしで話し言葉の理解を向上させる。

2025-11-01T00:14:10+00:00 ― 1 分で読む

サウンド音声分類技術の進展

新しい音を効率的に学ぶことで、音声分類を強化する新しい方法が登場した。

2025-10-31T22:37:00+00:00 ― 1 分で読む

サウンドテキスト音声変換適応技術の進展

新しい方法で、最小限のデータでTTSの適応が改善される。

2025-10-31T21:48:25+00:00 ― 1 分で読む

計算と言語音声認識システムにおける説明可能なAIの理解

自動音声認識における説明可能なAI手法の概要。

2025-10-31T20:11:15+00:00 ― 1 分で読む

サウンド MWAFMモデルで音声質問応答を進化させる

新しいモデルが機械が音声質問を理解して応答する方法を改善した。

2025-10-31T18:34:05+00:00 ― 1 分で読む

音声・音声処理テキスト読み上げシステムにおけるターンテイキングの評価

研究でTTS技術のターンテイキングを改善する必要があるって指摘されてるよ。

2025-10-31T17:45:30+00:00 ― 1 分で読む

計算と言語音声学習モデルの新しいベンチマーク

BabySLMは、機械が子供の言葉を基にして音声を理解する能力を評価するんだ。

2025-10-31T11:33:20+00:00 ― 1 分で読む

音声・音声処理合成音声を最適化して、ASRトレーニングを向上させる

新しい方法が合成音声の選択を改善して、ASRシステムの精度を向上させるよ。

2025-10-31T08:51:05+00:00 ― 1 分で読む

音声・音声処理新しい技術でスピーチ障害の調整を改善する

新しい方法が、不流暢な話し言葉をテキストと効率的に合わせるよ。

2025-10-31T08:02:30+00:00 ― 1 分で読む

サウンドサイレントスピーチインターフェースの進展

新しい技術でサイレントスピーチ認識システムを改善する。

2025-10-31T07:13:55+00:00 ― 1 分で読む