コンピューターサイエンス - サウンド

RSS

サウンド mixPGDトレーニングで音声認識を改善する

新しい方法が、敵対的な課題に対して自動音声認識を強化する。

2025-12-07T11:32:45+00:00 ― 1 分で読む

計算と言語騒がしい環境での意図分類の改善

この研究は、音声改善技術を使って意図分類を強化することに焦点を当ててるよ。

2025-12-07T01:01:10+00:00 ― 1 分で読む

サウンドマスクド・プライディクティブ・コーディングが音声認識に与える影響

この研究は、トレーニング技術が音声モデルのパフォーマンスにどう影響するかを調べてるよ。

2025-12-07T00:12:35+00:00 ― 1 分で読む

音声・音声処理音響特性を使った部屋の音響推定の進展

新しい方法で音の分析を使って部屋の音響推定が改善されるよ。

2025-12-06T18:32:30+00:00 ― 1 分で読む

サウンド音環境の強化：コンテキストの役割

新しいモデルは、ビジュアルや個人的な要素を取り入れて音の体験を向上させる。

2025-12-06T09:38:05+00:00 ― 0 分で読む

音声・音声処理小型デバイス向けの音声認識を進化させる

スマホやウェアラブルでの音声認識を良くするためのモデルサイズの縮小。

2025-12-06T04:46:35+00:00 ― 1 分で読む

サウンド感情豊かなテキスト読み上げ技術の進化

話し手のアイデンティティを維持しながら感情的なスピーチ合成のための新しい方法。

2025-12-06T03:09:25+00:00 ― 1 分で読む

サウンドスピーカー認識システムの公平性

異なるデモグラフィックにおける音声識別技術のバイアスを分析中。

2025-12-05T23:55:05+00:00 ― 1 分で読む

音声・音声処理音声コーディング技術の進展

新しいマルチバンド音声コーディング方法が音質と効率を向上させる。

2025-12-05T23:06:30+00:00 ― 1 分で読む

信号処理失語症の言語問題を検出する新しい方法

脳波トラッキングは、脳卒中後の言語障害を評価するのに期待できるってさ。

2025-12-05T19:03:35+00:00 ― 1 分で読む

サウンドデータフリー技術で音声認識を進化させる

新しいフレームワークがデータに大きくアクセスしなくても音声認識を改善するよ。

2025-12-05T17:26:25+00:00 ― 1 分で読む

サウンド因果オーディオトランスフォーマー：音声分類の進歩

新しいモデルが高度な技術を使って音声分類を改善したよ。

2025-12-05T16:37:50+00:00 ― 1 分で読む

音声・音声処理音響ソースローカリゼーションの進展

研究者たちは、音源を正確に特定する新しい方法を見つけてるよ。

2025-12-05T15:00:40+00:00 ― 1 分で読む

音声・音声処理騒がしい環境でのスピーチの明瞭さを改善する

新しいシステムがいろんな歪みに影響された音声信号を強化するんだ。

2025-12-05T03:40:30+00:00 ― 1 分で読む

サウンド深層学習を使った音声処理グラフの再構築

音声入力から音声処理セットアップを推定する新しい方法。

2025-12-05T02:03:20+00:00 ― 1 分で読む

サウンド音楽制作における拡散モデルの役割

拡散モデルが作曲家の音楽生成をどう変えているかを発見しよう。

2025-12-04T22:49:00+00:00 ― 1 分で読む

音声・音声処理 BCMを使って賑やかな環境で発話の明瞭さを向上させる

ボディ伝導マイクが背景ノイズにもかかわらず、スピーチの質をどう向上させるかを学ぼう。

2025-12-03T18:28:35+00:00 ― 1 分で読む

サウンド感情を通して音声と音楽をつなぐ

新しいシステムは、テキストなしで感情に基づいて音楽をスピーチにマッチさせるんだ。

2025-12-03T16:02:50+00:00 ― 0 分で読む

サウンド EarCough: 咳を監視する新しい方法

EarCoughは、スマートイヤフォンを使ってユーザーの咳を正確に検知するよ。

2025-12-03T15:14:15+00:00 ― 1 分で読む

サウンド音響イベント分類技術の進歩

新しい方法で、さまざまなスマートデバイスでの音の認識が向上するよ。

2025-12-03T11:59:55+00:00 ― 1 分で読む

マルチメディア継続的な感情認識の進展

複数のデータソースを使って感情検出を改善する研究。

2025-12-03T11:11:20+00:00 ― 1 分で読む

サウンドノイズ抑制の挑戦による話し言葉の明瞭さの向上

研究チームがバックグラウンドノイズの中でスピーチの品質を向上させるために競ってる。

2025-12-02T19:48:15+00:00 ― 1 分で読む

計算と言語カクテルHuBERT：音声認識の進化

複数話者の設定で音声認識を改善する新しいモデル。

2025-12-02T14:56:45+00:00 ― 1 分で読む

音声・音声処理音声認識技術の進歩

新しい方法が音声認識の精度と効率を向上させる。

2025-12-02T10:53:50+00:00 ― 0 分で読む

計算と言語無監視音声認識の進展

最近の手法は、ラベル付きデータに頼らずに音声認識を向上させている。

2025-12-01T19:30:45+00:00 ― 1 分で読む

サウンド LMCodec: 音声コーディングの新しいフロンティア

LMCodecは、音質を保ちながら効果的に音声を圧縮して、クリアなコミュニケーションを実現するよ。

2025-12-01T18:42:10+00:00 ― 1 分で読む

音声・音声処理自己教師あり学習で音声認識を進化させる

この記事では、自己教師あり学習が音声認識システムの改善にどう役立つかを紹介してるよ。

2025-12-01T17:53:35+00:00 ― 1 分で読む

マルチメディア AIOZ-GDANCEを紹介するよ: グループダンス生成のための新しいデータセット！

AIOZ-GDANCEは音楽に基づいたグループダンスの動きを作る研究を促進してるよ。

2025-12-01T11:24:55+00:00 ― 1 分で読む

機械学習マッコウクジラのコミュニケーションに関する新しい発見

この研究は、マッコウクジラの音のパターンとその意味の可能性を明らかにしてるよ。

2025-12-01T05:12:16+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識動画の音を特定する技術の進歩

研究が、動画内で音を出す物体を見つける機械の能力を向上させる。

2025-12-01T02:30:30+00:00 ― 1 分で読む

音声・音声処理音場再生技術の進展

この記事では、音の再生品質を向上させるための2つの方法を調べます。

2025-11-30T19:13:15+00:00 ― 0 分で読む

サウンド音楽のセグメンテーションの技術：もう少し詳しく見てみよう

音楽の構造がリスニング体験をどう変えるかを探ってみよう。

2025-11-30T16:47:30+00:00 ― 1 分で読む

サウンド音楽構造分析の進展

音楽の構造を分ける新しい方法を探って、その影響について考えてる。

2025-11-30T11:07:25+00:00 ― 1 分で読む

計算と言語歌の翻訳の革新的な方法

メロディに合うように歌詞をうまく翻訳する新しいアプローチ。

2025-11-29T10:49:55+00:00 ― 1 分で読む

サウンドアダプティブな背景音楽で格闘ゲームを強化する

この研究は、DareFightingICEでプレイヤーの洞察のために適応音楽を使うことを考察してるんだ。

2025-11-29T01:06:55+00:00 ― 1 分で読む

サウンド新しいデータセットが口の動き読み取り技術の向上を目指してるよ

研究者たちがより良い口読システムのためにLIPSFUSデータセットを開発した。

2025-11-28T23:29:45+00:00 ― 1 分で読む

機械学習ラベルなしデータを使ったスピーカー認証の進展

このフレームワークは、ラベルのないデータとクラスタリング技術を使ってスピーカー認証を強化するんだ。

2025-11-28T19:26:50+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクションウェアラブル感情認識システムの進展

新しいフレームワークが自己教師あり学習を使って感情検出を強化する。

2025-11-28T14:35:20+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識動画からリアルな音を生成する新しい方法

このアプローチは、物理を使って動画のアクションと音を結びつけて、より良い音効果を実現するんだ。

2025-11-28T12:58:10+00:00 ― 0 分で読む

コンピュータビジョンとパターン認識視覚的手がかりで音声認識を向上させる

既存のモデルを使って視覚データで音声認識を強化する新しい方法が登場した。

2025-11-28T10:32:25+00:00 ― 1 分で読む