コンピューターサイエンス - サウンド

RSS

音声・音声処理バーチャルエージェントのためのジェスチャーの適応

バーチャルエージェントは、人間のジェスチャーを真似ることで、より良いインタラクションを学んでる。

2025-11-04T18:06:55+00:00 ― 1 分で読む

サウンド NAS-FMを使った音合成の簡素化

ミュージシャンにメリットがあるシンセサイザーを作る新しい方法。

2025-11-04T17:18:20+00:00 ― 1 分で読む

音声・音声処理アクティブスピーカー検出技術の進展

新しいフレームワークが音声と映像の手がかりを使ってアクティブスピーカーの検出を改善する。

2025-11-04T16:29:45+00:00 ― 1 分で読む

サウンド高度な脅威に対する音声認証の強化

自動スピーカ認証システムの課題と防御策を見てみよう。

2025-11-04T15:41:10+00:00 ― 1 分で読む

サウンド現代通信における光ネットワークの役割

光ネットワークは速いデータ転送を可能にして、コミュニケーション技術の未来を形作ってるんだ。

2025-11-04T14:04:00+00:00 ― 1 分で読む

音声・音声処理スピーチタスクのための一般音響モデルの改善

新しい方法が一般的な音声モデルを強化して、効果的な音声認識を実現する。

2025-11-04T05:58:10+00:00 ― 1 分で読む

計算と言語会話における感情認識の進展

新しいモデルは対話の感情理解を向上させる。

2025-11-04T05:09:35+00:00 ― 1 分で読む

計算と言語新しいモデルが音声翻訳の質を向上させた

モデルは話し言葉とテキストを組み合わせて翻訳精度を向上させる。

2025-11-04T04:21:00+00:00 ― 1 分で読む

機械学習人間のスピーチモデルを使ってマーモセットの鳴き声を研究する

研究では、人間の音声モデルを使ってマーモセットの声を効果的に分析してるよ。

2025-11-04T03:32:25+00:00 ― 1 分で読む

音声・音声処理肺音解析技術の進歩

新しい方法で音データを使って呼吸器疾患の早期発見が改善されたよ。

2025-11-04T02:43:50+00:00 ― 1 分で読む

サウンド幸せな笑いとあざけりの笑いの違いを見分ける

この研究は、笑いが音の分析を通じて感情をどう伝えるかを調べてるよ。

2025-11-04T01:55:15+00:00 ― 1 分で読む

音声・音声処理 EfficientSpeech: デバイス上でのテキスト読み上げ技術

新しいモデルがインターネットなしでデバイスに音声機能をもたらす。

2025-11-04T01:06:40+00:00 ― 1 分で読む

サウンド感情テキスト読み上げ技術の進歩

新しいモデルZET-Speechが多様な話者のための感情的な音声合成を強化しました。

2025-11-03T23:29:30+00:00 ― 1 分で読む

サウンドピアノとバイオリン音楽のトランスクリプションの進化

研究によると、新しいミキシング技術が音楽のトランスクリプション精度を向上させることがわかった。

2025-11-03T21:52:20+00:00 ― 1 分で読む

サウンド共感的対話で人間と機械のインタラクションを進化させる

新しい方法が、より良い感情理解を通じて機械の反応を向上させる。

2025-11-03T21:03:45+00:00 ― 1 分で読む

サウンド複数話者環境での音声認識の進化

新しい方法が会議の音声認識の精度を向上させる。

2025-11-03T20:15:10+00:00 ― 1 分で読む

サウンド CALLSで共感的な音声アシスタントを開発する

CALLSは、音声アシスタントが顧客とのやり取りをうまく処理できるようにすることを目指してる。

2025-11-03T19:26:35+00:00 ― 1 分で読む

音声・音声処理音声インペインティング技術の進歩

新しい方法が音声の修復と制作品質を向上させてるよ。

2025-11-03T17:49:25+00:00 ― 1 分で読む

サウンド PLCMOSで音質測定を革新する

PLCMOSは、人間のリスナーなしでスピーチの品質を評価する新しい方法を提供してるよ。

2025-11-03T10:32:10+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクションループボックス: 音楽を作る新しい方法

LoopBoxesは子供たちが簡単に協力して音楽を作れるように手助けするよ。

2025-11-03T08:55:00+00:00 ― 1 分で読む

サウンドニューラルネットワークを使った革新的なサウンド合成

ニューラルネットワークを使ってリアルな衝撃音を作る新しい方法。

2025-11-03T08:06:25+00:00 ― 1 分で読む

計算と言語非ネイティブスピーカーのための音声認識の改善

新しい技術で、ASRシステムが非ネイティブアクセントの認識がもっと良くなるよ。

2025-11-03T02:26:20+00:00 ― 1 分で読む

音声・音声処理弱教師あり学習で音声認識を進化させる

新しい方法はスピーカーのアイデンティティを活用して音声認識のパフォーマンスを向上させる。

2025-11-03T01:37:45+00:00 ― 1 分で読む

サウンドサイドカーアプローチで音声認識を改善する

新しい方法は、重なり合ったスピーチのために音声認識と話者識別を組み合わせるんだ。

2025-11-03T00:49:10+00:00 ― 1 分で読む

計算と言語 DiSegを使った同時音声翻訳の進展

新しい方法がリアルタイム翻訳の質と効率を向上させる。

2025-11-03T00:00:35+00:00 ― 1 分で読む

サウンド複数の音源を使った部屋のインパルス応答の推定

複雑な音環境での部屋の反応を推定する新しい方法。

2025-11-02T21:34:50+00:00 ― 1 分で読む

音声・音声処理音声変換技術の進展

音声変換の新しい方法が明瞭さと適応性を向上させたよ。

2025-11-02T19:57:40+00:00 ― 1 分で読む

サウンド MeLoDyの紹介: 速攻音楽生成が明らかに

MeLoDyは、テキストプロンプトから高品質な音楽をすぐに生成するよ。

2025-11-02T17:31:55+00:00 ― 1 分で読む

サウンド音声認識システムのセキュリティ脅威への対処

新しい方法が出てきて、音声認識を敵対的攻撃から守るようになったよ。

2025-11-02T16:43:20+00:00 ― 1 分で読む

サウンド新しい方法が拡散モデルのプライバシーリスクを明らかにした

拡散モデルのトレーニングデータの露出をチェックする新しい手法。

2025-11-02T13:29:00+00:00 ― 1 分で読む

サウンド S4Mを使った音声分離の進展

新しいモデルは、騒がしい環境での声の隔離を改善する。

2025-11-02T10:14:40+00:00 ― 1 分で読む

音声・音声処理デジタルツールで磁気テープの音を再現する

この記事では、デジタル技術を使って磁気テープの音を再現する方法について話してるよ。

2025-11-02T09:26:05+00:00 ― 1 分で読む

音声・音声処理 OS-KDFT法によるスピーカー認証の改善

新しい方法で、知識蒸留とファインチューニングを組み合わせてスピーカー認証を強化するんだ。

2025-11-01T22:05:55+00:00 ― 1 分で読む

音声・音声処理 DeCoR: 音声学習の新しい方法

DeCoRは、機械が古い音を忘れずに新しい音を学ぶのを助けるんだ。

2025-11-01T21:17:20+00:00 ― 1 分で読む

サウンドリアルタイムオーディオタグ付けの進展

ストリーミングオーディオトランスフォーマーは、オーディオタグ付けシステムの速度と効率を向上させる。

2025-11-01T20:28:45+00:00 ― 1 分で読む

計算と言語音声文字起こしの方法の進展

新しい技術が音声をテキストに変換する精度と速度を向上させてるよ。

2025-11-01T16:25:50+00:00 ― 1 分で読む

サウンド構音障害のスピーチ評価：クリアさを高める新しい方法

この研究は、構音障害のある人たちがより明確にコミュニケーションできるように、改善された評価方法を紹介しているよ。

2025-11-01T15:37:15+00:00 ― 1 分で読む

サウンド音声認識の課題に対処するための異和音の言葉

新しい方法で、似たような音の名前の音声認識が向上した。

2025-11-01T14:48:40+00:00 ― 1 分で読む

音声・音声処理 TTSシステムにおけるスピーチの多様性向上

新しい方法がテキスト読み上げの自然さとバリエーションを向上させるよ。

2025-11-01T13:11:30+00:00 ― 1 分で読む

音声・音声処理 Treffアダプターを使った音声分類の進展

Treffアダプターは、ラベル付きデータが限られた状態で音声分類を改善する。

2025-11-01T12:22:55+00:00 ― 1 分で読む