電気工学・システム科学 - 音声・音声処理

RSS

計算と言語文脈を通じた音声翻訳の進展

新しい方法は文脈情報に注目して音声翻訳を改善する。

2025-09-02T22:24:45+00:00 ― 1 分で読む

サウンドコードスイッチングデータで音声技術を進化させる

新しい方法でコードスイッチングユーザーの音声認識が改善されたよ。

2025-09-02T21:36:10+00:00 ― 1 分で読む

音声・音声処理異常音検出を活用してより良い結果を得る

音の分析が機械の問題を効率的に特定するのにどう役立つかを学ぼう。

2025-09-02T20:47:35+00:00 ― 1 分で読む

計算と言語音声翻訳と字幕の進歩

このプロジェクトはリアルタイムの音声翻訳と自動字幕システムを強化するんだ。

2025-09-02T18:21:50+00:00 ― 1 分で読む

サウンドニューラルネットワークにおける一般化の新しい知見

ミニマの鋭さが未見の音声データに対するモデルのパフォーマンスにどう影響するかを探る。

2025-09-02T15:56:05+00:00 ― 1 分で読む

サウンド声と顔を組み合わせてより良い識別を実現

新しい手法が音声と映像データを統合してスピーカー認証を改善したよ。

2025-09-02T07:50:15+00:00 ― 0 分で読む

サウンド音楽表現学習におけるトランスフォーマー

トランスフォーマーを使った音楽タグ付けと表現の効果的な研究。

2025-09-02T07:01:40+00:00 ― 1 分で読む

マルチメディア音声映像スピーカーの位置特定の進展

音声と視覚データを使ってスピーカートラッキングを強化する新しい方法。

2025-09-02T06:13:05+00:00 ― 1 分で読む

サウンドピアノ曲の難易度分析の新しい方法

楽譜の画像を使ってピアノの音楽の難しさを評価する新しいアプローチ。

2025-09-02T05:24:30+00:00 ― 1 分で読む

音声・音声処理 PP-MeTシステムで会議の文字起こしを改善する

PP-MeTは、複数の話者がいる会議の文字起こしの精度を向上させることを目指しているよ。

2025-09-02T04:35:55+00:00 ― 1 分で読む

音声・音声処理音声強化の普遍的アプローチ

この研究は、いろんな条件でスピーチの明瞭さを改善するモデルを提示してるよ。

2025-09-02T02:10:10+00:00 ― 1 分で読む

サウンド自動音声キャプションの台頭

自動音声キャプションの進歩とそのアクセシビリティへの影響を探る。

2025-09-02T01:21:35+00:00 ― 1 分で読む

サウンド音声と映像データを使った革新的なスピーチ分離

研究が騒がしい環境でのスピーチの明瞭さを改善する効果的な方法を紹介してるよ。

2025-09-02T00:33:00+00:00 ― 1 分で読む

機械学習伝統的なエフェクトを使った音声スタイルマッチングの進化

新しい方法が、微分不可能なエフェクトを使ってオーディオスタイル転送を簡素化する。

2025-09-01T19:41:30+00:00 ― 1 分で読む

サウンドコンピュータ生成のピアノ演奏の質を評価する

研究は、リスニングテストを通じてコンピュータ音楽と人間の演奏の比較を調べている。

2025-09-01T07:32:45+00:00 ― 0 分で読む

音声・音声処理ウルトラスフェリカル多項式でサウンドデザインを強化する

ウルトラスフィアポリノミアルが音響技術や音の方向性をどう改善するか学ぼう。

2025-09-01T05:55:35+00:00 ― 1 分で読む

音声・音声処理 AIによる音場再構成の進化

異なる環境で音を再現する方法を改善するためにAIを使う。

2025-09-01T01:52:40+00:00 ― 1 分で読む

音声・音声処理 SSRLで音声認識を進化させる

新しい方法が、少ないラベルとリソースで音声認識を改善する。

2025-09-01T00:15:30+00:00 ― 1 分で読む

サウンドテキストからオーディオへのグラウンディング技術の進展

新しい方法でテキストの説明を音のイベントにリンクさせるのがもっと簡単になったよ。

2025-08-31T16:09:40+00:00 ― 1 分で読む

音声・音声処理移動ロボットにおける音の方向検出

革新的な方法が、ロボットが動いている間の音の方向処理を改善する。

2025-08-31T14:32:30+00:00 ― 0 分で読む

音声・音声処理ビームフォーミング技術の進展

実数値ビームフォーミングとそれがマイクロフォンアレイに与えるメリットを学ぼう。

2025-08-31T12:06:45+00:00 ― 1 分で読む

音声・音声処理会話型テキスト音声変換モデルの進展

小さくて効率的で自然な音声生成の新しいアプローチ。

2025-08-31T09:41:00+00:00 ― 1 分で読む

サウンド AIによる音楽生成の新しいモデル

MusicAOGは、革新的なグラフ表現を通じて音楽の制作と理解を簡単にするよ。

2025-08-31T08:52:25+00:00 ― 1 分で読む

音声・音声処理球面アレイを使った効果的なMIMOシステムの設計

音響研究における球面マイクロフォンとスピーカーアレイを組み合わせる新しいフレームワーク。

2025-08-31T07:15:15+00:00 ― 1 分で読む

音声・音声処理ヒューマノイドロボットのための効果的な聴覚システムの設計

マイクロフォンアレイ設計を通じて、人型ロボットの音検出を改善するための新しいフレームワーク。

2025-08-31T06:26:40+00:00 ― 1 分で読む

音声・音声処理 MIMOシステムを使った部屋の音響改善

MIMOシステムがいろんな環境で音の分析をどう良くするか発見しよう。

2025-08-31T02:23:45+00:00 ― 1 分で読む

音声・音声処理部屋の音響研究の進展

新しい技術が音の方向推定をいろんな音響環境で改善してるよ。

2025-08-31T01:35:10+00:00 ― 1 分で読む

音声・音声処理クリアなリスニング体験のための音のコントロール

研究によると、部屋の音の振る舞いを調整して明瞭さを向上させる方法がわかったよ。

2025-08-31T00:46:35+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 FunnyNet-Wを使った動画のユーモア検出

新しいモデルがビデオの面白い瞬間を視覚、音声、テキストデータを使って特定するんだ。

2025-08-30T23:09:25+00:00 ― 1 分で読む

音声・音声処理技術のための誘電エラスチマーの進展

電気エラスマーは電気エネルギーを機械的動きに変換して、いろんな用途があるんだ。

2025-08-30T20:43:40+00:00 ― 1 分で読む

計算と言語 ASR技術を使って認知症診断を助ける

誤りのあるASRトランスクリプトは、アルツハイマーをもっと正確に特定するのに役立つ。

2025-08-30T16:40:45+00:00 ― 1 分で読む

計算と言語 ELLA-Vを紹介するよ：音声合成の新しい章だ！

ELLA-Vはテキスト読み上げの品質とコントロールを向上させて、以前のモデルを超えたよ。

2025-08-30T01:17:40+00:00 ― 1 分で読む

定量的手法新しい方法が野生動物の音響モニタリングを強化するよ。

新しいアプローチで動物の鳴き声検出精度が、恣意的な閾値なしで向上したよ。

2025-08-29T23:46:39+00:00 ― 1 分で読む

計算と言語マルチモーダルデータを使った音声分類の進展

新しいモデルは、音声とテキストを統合して、より良いスピーチ分類を実現してるよ。

2025-08-29T18:49:00+00:00 ― 1 分で読む

サウンド NOTSOFAR-1チャレンジ：ミーティング文字起こし技術の進化

大きな部屋での会議用にトランスクリプション技術を改善する新しい取り組み。

2025-08-29T16:23:15+00:00 ― 1 分で読む

計算と言語音声認識のエラー修正の進展

新しい方法が、大規模言語モデルを使った騒がしい音声認識の精度を向上させるよ。

2025-08-29T01:48:45+00:00 ― 1 分で読む

サウンドより良い農業のための産卵鶏の鳴き声の理解

鶏の鳴き声を分析することで、健康や農場の生産性が向上するんだ。

2025-08-29T00:11:35+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクションサウンドアンブレンディング：ミックスドリアリティのための新しいツール

混合現実で視覚障害者が音を認識する手助けをする方法。

2025-08-28T20:57:15+00:00 ― 1 分で読む

音声・音声処理リソースの少ない言語のスピーチテクノロジーの課題に取り組む

この記事では、書き起こしデータが限られている言語の音声アプリケーションの解決策について話しているよ。

2025-08-28T18:31:30+00:00 ― 1 分で読む

機械学習投影ベイジアンネットワークを使った音分類の進展

研究者たちは、音声分類を改善するために生成的と識別的な手法を組み合わせている。

2025-08-28T16:05:45+00:00 ― 1 分で読む