電気工学・システム科学 - 音声・音声処理

RSS

音声・音声処理音声言語技術の新しいインサイト

話し言葉の科学の方法と応用の進展を新たな視点で見る。

2025-09-19T01:27:35+00:00 ― 1 分で読む

情報検索ミュージックビデオから学ぶ上での課題

この研究は、音楽ビデオ理解のための対照学習を使う際の難しさを調べてるんだ。

2025-09-18T17:21:45+00:00 ― 0 分で読む

計算と言語スピーチと言語モデルをつなぐ：BLSPメソッド

新しいアプローチが音声と言語モデルの統合を強化する。

2025-09-18T15:44:35+00:00 ― 1 分で読む

音声・音声処理構音障害における音声運動予測の進展

自己教師あり学習を使って、構音障害の発話動作の予測を向上させる。

2025-09-18T12:30:15+00:00 ― 1 分で読む

サウンド MDSCを使ってダンス音楽のつながりを評価する

音楽とダンススタイルの一致を評価する新しい指標。

2025-09-18T11:41:40+00:00 ― 1 分で読む

計算と言語 TTSにおける事前学習済み言語モデルの役割

事前学習した言語モデルがテキスト音声変換の品質をどう向上させるかを調べる。

2025-09-17T20:18:35+00:00 ― 1 分で読む

音声・音声処理 BWSNet: 音声知覚評価の進化

新しいモデルは、ベスト・ワースト・スケーリングを使って人間のフィードバックを通じて音声知覚を評価するんだ。

2025-09-17T13:49:55+00:00 ― 1 分で読む

サウンド音楽ソース分離技術の進歩

新しい方法が音楽トラックの音声コンポーネントのクリアさを向上させる。

2025-09-17T08:09:50+00:00 ― 1 分で読む

音声・音声処理 BandItで映画音声の分離を改善する

BandItは革新的なディープラーニング技術を使って音声ソースの分離を強化します。

2025-09-17T06:32:40+00:00 ― 1 分で読む

音声・音声処理スピーチ感情認識システムのパーソナライズ

感情認識技術を調整すると、さまざまな話者に対する精度が向上するよ。

2025-09-17T04:55:30+00:00 ― 1 分で読む

サウンド声のアイデンティティモーフィング：安全への脅威

研究によると、モーフサンプルを使った音声認識には深刻な脅威があるみたい。

2025-09-17T04:06:55+00:00 ― 1 分で読む

サウンドバティック・プレイズ・モーツァルト：包括的なピアノデータセット

モーツァルトのソナタとピアノ演奏、専門家の注釈を組み合わせた詳細なデータセット。

2025-09-17T03:18:20+00:00 ― 1 分で読む

音声・音声処理リモートミーティングの音質を向上させる

新しいイヤフォンデザインは、骨伝導技術を使って音の明瞭さを向上させてるよ。

2025-09-17T02:29:45+00:00 ― 1 分で読む

音声・音声処理自己教師あり学習による音高推定の進歩

新しい軽量モデルが自己教師あり学習技術を使って音程の推定を改善する。

2025-09-17T00:04:00+00:00 ― 1 分で読む

サウンド音楽構造分析技術の進展

音楽のセグメント識別と分析を改善する新しいアプローチ。

2025-09-16T23:15:25+00:00 ― 1 分で読む

サウンドフェイクソング検出：新しいデータセットアプローチ

増え続ける懸念の中で偽の曲を特定するための新しい方法が開発された。

2025-09-16T22:26:50+00:00 ― 1 分で読む

計算と言語 Cleancoderで音声認識を改善する

Cleancoderは、背景ノイズを減らして音声理解をよりクリアにすることでASRシステムを向上させるんだ。

2025-09-16T21:38:15+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 RADIO：トーキングヘッズへの新しいアプローチ

RADIOは、たった一枚の参照画像からリアルな話す顔を作り出す。

2025-09-16T16:46:45+00:00 ― 1 分で読む

計算と言語 RoDia：ルーマニア方言識別のための新しいデータセット

RoDiaはルーマニアの方言を特定するための重要な音声サンプルを提供してるよ。

2025-09-16T15:58:10+00:00 ― 1 分で読む

音声・音声処理コミュニケーションにおける非言語的サインの役割

ジェスチャーや表情が話し言葉の理解をどう深めるか探ってるんだ。

2025-09-16T08:40:55+00:00 ― 0 分で読む

ヒューマンコンピュータインタラクション音楽ミキシングのアートとサイエンス

音楽をミックスすることを見てみよう。技術的なスキルとアーティスティックなビジョンを融合させる感じ。

2025-09-16T07:03:45+00:00 ― 1 分で読む

音声・音声処理音イベント検出と位置特定の進展

合成データを使って音の検出と位置特定の新しい方法を探ってる。

2025-09-16T05:26:35+00:00 ― 1 分で読む

音声・音声処理音響シミュレーションシステム for ミュージシャン

新しいシステムが音楽家に仮想ステージで音を体験させるよ。

2025-09-16T03:00:50+00:00 ― 0 分で読む

サウンド部分的に偽造された音声を検出する技術の進歩

新しい方法が録音内の偽音声セグメントの検出を向上させた。

2025-09-16T01:23:40+00:00 ― 1 分で読む

サウンド音楽技術の進歩：リズムとハーモニーの分離

コンピュータが音楽のリズムとハーモニーを分けることを学んでるんだって、クリエイティブな応用のために。

2025-09-15T23:46:30+00:00 ― 1 分で読む

音声・音声処理 MuLanTTS: テキストから音声への新しいフロンティア

マイクロソフトのMuLanTTSは、自然で表現力豊かなフランス語のテキスト読み上げ機能を提供してるよ。

2025-09-15T22:57:55+00:00 ― 1 分で読む

サウンド音響交通監視技術の進歩

新しいデータセットと手法で車両分類が改善されて、交通管理がもっと良くなるよ。

2025-09-15T13:14:55+00:00 ― 1 分で読む

サウンド自動音声認識システムの進展

新しい方法が音声認識技術の精度と速度を向上させる。

2025-09-15T06:46:15+00:00 ― 1 分で読む

サウンド機械学習を使ったフォーリーサウンド合成の進歩

新しいシンセサイザーがメディアのリアルな音効の生成を改善するよ。

2025-09-15T05:57:40+00:00 ― 1 分で読む

音声・音声処理自動音声認識における信頼度推定の向上

新しいアプローチがASRシステムの自信推定を強化して、精度を向上させる。

2025-09-15T03:14:28+00:00 ― 1 分で読む

サウンド音声生成技術の進歩

より自然で表現力豊かな音声合成のためのフレームワークを紹介。

2025-09-15T01:06:10+00:00 ― 1 分で読む

サウンドテクノロジーで音楽ジャンルを分類する

テクノロジーが音楽ジャンルを効率よくカテゴライズするのにどう役立つかを学ぼう。

2025-09-14T21:51:50+00:00 ― 1 分で読む

サウンド新モデルで魚の給餌強度評価が向上したよ

音声と映像データを使って魚の食事を評価する統一的なアプローチ。

2025-09-14T21:03:15+00:00 ― 1 分で読む

サウンド感情を持ったトーキングヘッド技術の進歩

新しい方法が感情豊かなトーキングヘッド動画の制作を改善したよ。

2025-09-14T15:23:10+00:00 ― 1 分で読む

機械学習音声フィルタバンク設計におけるConvnetの利用に関する課題

この研究は、オーディオフィルターバンク作成におけるコンボリューショナルネットワーク（convnet）の使用に関する問題を探っているよ。

2025-09-14T14:34:35+00:00 ― 1 分で読む

サウンド音声と言語モデルの進化

CLAPモデルは、さまざまなアプリケーションのために音声とテキスト処理をつなげるよ。

2025-09-14T13:46:00+00:00 ― 1 分で読む

計算と言語フランス語音声技術のための自己教師あり学習の進展

プロジェクトは自己教師あり学習を使ってフランス語の音声処理を改善することを目指してる。

2025-09-14T12:57:25+00:00 ― 1 分で読む

音声・音声処理自動韻律注釈の進展

新しい方法で、機械がスピーチのリズムや感情を認識するのが改善されてる。

2025-09-14T12:08:50+00:00 ― 1 分で読む

サウンド散乱環境における音の推定の新しい方法

新しいアプローチで、散乱物体がある空間での音の推定が改善されたよ。

2025-09-14T06:28:45+00:00 ― 0 分で読む

サウンド音楽制作における非決定性の影響

undecidabilityが今の音楽作曲や制作にどんな影響を与えてるかを探る。

2025-09-14T05:40:10+00:00 ― 1 分で読む