電気工学・システム科学 - 音声・音声処理

RSS

計算と言語音声合成技術の進歩

新しい手法が自己教師あり学習を使って合成音声の品質を向上させてるよ。

2025-09-30T17:37:25+00:00 ― 1 分で読む

計算と言語キーワードブースティングで音声認識を改善する

新しい方法がビジネス会話における珍しいキーワードの書き起こしを強化するんだ。

2025-09-30T10:20:10+00:00 ― 1 分で読む

サウンドフェデレーテッドラーニングで音声認識を進化させる

フェデレーテッドラーニングは、ユーザーデータをプライベートに保ちながら、音声認識を向上させるんだ。

2025-09-30T08:43:00+00:00 ― 1 分で読む

サウンド MusicLDM: テキストから音楽を生成する新しいアプローチ

MusicLDMはテキストをオリジナルの音楽に変えて、クリエイティビティの新しい道を提供してるよ。

2025-09-30T05:28:40+00:00 ― 1 分で読む

サウンドディープラーニングを使った歌メロディ抽出技術の向上

新しい方法でミックス音声から歌のメロディを抽出する精度が向上してるよ。

2025-09-30T01:25:45+00:00 ― 1 分で読む

サウンド音声強化技術の進展

新しいモデルは革新的な方法を使って、騒がしい環境でのスピーチの明瞭さを向上させるよ。

2025-09-29T22:11:25+00:00 ― 1 分で読む

サウンドテクノロジーで韓国民謡を分析する

現代的な分析手法を使った韓国民謡の研究。

2025-09-29T21:22:50+00:00 ― 1 分で読む

グラフィックス DiffDance: ダンス生成の新時代

DiffDanceは音楽にぴったり合った詳細なダンスシーケンスを作るよ。

2025-09-29T16:31:20+00:00 ― 1 分で読む

サウンド歌声の文字起こしにおける性別バイアスへの対処

男女間の歌声転写技術の公平性を調べる。

2025-09-29T15:42:45+00:00 ― 1 分で読む

サウンド ASRシステムのホットワードカスタマイズの進展

SeACo-Paraformerは、音声認識技術に柔軟性と精度をもたらすよ。

2025-09-29T14:05:35+00:00 ― 1 分で読む

音声・音声処理声の質とその影響を調べる

この研究は、音声品質の分類方法とそれがコミュニケーションでの重要性について探ってるよ。

2025-09-29T12:28:25+00:00 ― 1 分で読む

音声・音声処理アクティブノイズコントロール技術の進展

新しいアルゴリズムがさまざまなアプリケーションのノイズキャンセリング技術をどう改善するかを学ぼう。

2025-09-29T05:59:45+00:00 ― 1 分で読む

音声・音声処理新しいツールが動画インサイトで音質を測定するよ

AudioVMAFは、音声品質評価を向上させるために動画の指標を組み合わせてるよ。

2025-09-29T01:56:50+00:00 ― 1 分で読む

サウンド RAWMを使ったフェイクオーディオ検出の進展

新しい手法が適応的な重みの変更を使って、偽音声の検出を改善したよ。

2025-09-29T01:08:15+00:00 ― 1 分で読む

暗号とセキュリティ情報セキュリティにおけるステガナリシスの必要性の高まり

ステガナリシスはマルチメディアに隠されたメッセージを見つけるのを助けて、安全なコミュニケーションを確保するんだ。

2025-09-28T23:31:05+00:00 ― 1 分で読む

音声・音声処理スピーカーのアイデンティティを音声データから分離する

音声信号から話者のアイデンティティを分離して処理を改善する研究。

2025-09-28T19:28:10+00:00 ― 1 分で読む

マルチメディア TranSTYLer: バーチャルコミュニケーションの飛躍

意味を保ったまま、バーチャルエージェントのジェスチャーを変換する。

2025-09-28T18:39:35+00:00 ― 1 分で読む

サウンドニューラルネットワークを使った音源定位の進展

音源定位の精度を向上させるためのニューラルネットワークの研究。

2025-09-28T12:10:55+00:00 ― 1 分で読む

計算と言語自己学習法を使ってパンジャビ語の音声認識を改善する

研究者たちは、革新的な自己学習技術を使ってパンジャビ語の自動音声認識を向上させた。

2025-09-28T08:56:35+00:00 ― 1 分で読む

サウンドターゲットスピーカーの音声認識の進展

新しいモデルは、騒がしい環境でのスピーチ認識を一人の話者に集中させることで改善するよ。

2025-09-28T08:08:00+00:00 ― 1 分で読む

サウンドプライバシーとスマートオーディオモニタリングのバランスをとる

新しい方法が音声監視システムでの発言のプライバシーを守ることを目指している。

2025-09-28T06:30:50+00:00 ― 0 分で読む

計算と言語新しいデータセットで表現豊かな音声合成を進化させる

新しいデータセットが、テキストに頼らずに感情表現を捉えることで音声合成を強化するんだ。

2025-09-27T18:22:05+00:00 ― 1 分で読む

音声・音声処理 SDTWを使って音楽のピッチ分類を改善する

音のピッチ分類のためのトレーニングの安定性を高める新しい戦略。

2025-09-27T13:30:35+00:00 ― 1 分で読む

サウンド音声変換技術の進展

フォニームハルシネーターは、限られたデータで音声変換を変えて、よりクリアな出力を実現するよ。

2025-09-27T10:16:15+00:00 ― 1 分で読む

サウンドデジタルヒューマンのためのジェスチャー生成の進化

新しい方法で、生の音声データからリアルなジェスチャーを作れるようになった。

2025-09-27T08:39:05+00:00 ― 1 分で読む

機械学習発話中の脳活動を分析する新しい方法

研究者たちが、話すタスク中の脳信号をよりよく解釈するためにニューラルラテントアライナーを開発したよ。

2025-09-27T05:24:45+00:00 ― 1 分で読む

音声・音声処理グラフェム単位を使ったバイリンガル音声認識の進展

グラフェムユニットを使ってバイリンガル音声のためのハイブリッドASRシステムを強化する。

2025-09-27T03:47:35+00:00 ― 1 分で読む

計算と言語音声とテキストの共同学習の進展

新しいモデルが音声とテキストの整合性を改善して、自動認識をより良くするよ。

2025-09-27T02:10:25+00:00 ― 1 分で読む

サウンド Lip2Vecを使った視覚的音声認識の進展

Lip2Vecは、少ないラベル付きデータで視覚的スピーチ認識を強化する。

2025-09-27T01:21:50+00:00 ― 1 分で読む

計算と言語音声認識技術の進展

新しい方法が音声認識システムの精度と速度を向上させる。

2025-09-26T11:35:55+00:00 ― 1 分で読む

機械学習 O-1: 音声認識トレーニングの新しいフロンティア

O-1は自己学習法を最適化することで音声認識を改善する。

2025-09-26T09:10:10+00:00 ― 1 分で読む

計算と言語テキストインジェクションで自動音声認識を改善する

新しい手法がテキストデータの統合を通じてASRの性能を向上させる。

2025-09-26T07:33:00+00:00 ― 1 分で読む

計算と言語テキストインジェクションで音声認識を改善する

テキストインジェクションは、プライバシーを守りつつ個人情報を認識するのに役立つよ。

2025-09-26T06:44:25+00:00 ― 1 分で読む

サウンド生成学習を用いた音イベント検出の進展

新しい技術がいろんな応用における音イベント検出をどう変えてるかを発見しよう。

2025-09-26T05:55:50+00:00 ― 1 分で読む

音声・音声処理非線形オーディオ処理の重要性

音楽制作や音声分析のための非線形手法を探る。

2025-09-26T03:30:05+00:00 ― 1 分で読む

サウンド PitchNetを使った音高抽出の進展

音楽やサウンドの正確な音程検出のための新しい方法。

2025-09-26T02:41:30+00:00 ― 1 分で読む

サウンド mmWave技術による音声認識の進歩

Radio2Textは、騒がしい環境でのリアルタイム音声認識にmmWave信号を使ってるよ。

2025-09-25T22:38:35+00:00 ― 1 分で読む

音声・音声処理都市公園における自動音マスカシステムの評価

研究が公共スペースにおける自動音マスカーの効果を調べてるよ。

2025-09-25T18:35:40+00:00 ― 1 分で読む

音声・音声処理グラフニューラルネットワークを使ったスピーカー認識の進展

グラフニューラルネットワークは、声のサンプルの関係を分析することでスピーカー認識の精度を向上させる。

2025-09-25T09:41:15+00:00 ― 1 分で読む

計算と言語言語を超えた音声感情認識の進展

6つの言語でのスピーチモデルの感情認識を評価する研究。

2025-09-25T08:04:05+00:00 ― 1 分で読む