電気工学・システム科学 - 音声・音声処理

RSS

計算と言語音声認識における電話分類の改善

この記事は、音声特徴を使って電話の分類を強化する方法について話してるよ。

2025-11-07T21:25:10+00:00 ― 1 分で読む

音声・音声処理進化するAI：人間のような音声理解

新しいモデルがAIの音声認識と推論能力を向上させる。

2025-11-07T16:33:40+00:00 ― 1 分で読む

サウンド NASSを使った音声分離の進展

NASSは騒がしい環境での声の隔離を改善して、従来の方法よりも優れてるよ。

2025-11-07T15:45:05+00:00 ― 1 分で読む

音声・音声処理音声強化による合成音声の改善

合成音声作成のための音質向上の新しいアプローチ。

2025-11-07T14:07:55+00:00 ― 1 分で読む

音声・音声処理マルチタスク学習による音イベント検出の進展

新しい技術が音声認識の効率を向上させ、ラベリングコストを削減する。

2025-11-07T13:19:20+00:00 ― 1 分で読む

サウンドより正確な音質メトリクスの更新

新しいラウドネス計算方法を使って音質メトリクスを向上させる。

2025-11-07T12:30:45+00:00 ― 1 分で読む

計算と言語リアルタイム音声翻訳の進展

AlignAttは、同時スピーチ翻訳の速度と品質を向上させます。

2025-11-07T11:42:10+00:00 ― 1 分で読む

サウンドスピーチモデルにおけるプライバシーと効率のバランス

新しい方法で、性能を犠牲にせずにスピーチ分類のプライバシーが確保される。

2025-11-07T10:05:00+00:00 ― 1 分で読む

サウンドスムーズにテキスト読み上げアクセントを調整する

この研究は、さまざまなアクセントにTTS技術を効率的に適応させる方法を示してるよ。

2025-11-07T09:16:25+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクション AMIIモデルを使って社会的インタラクティブエージェントを進化させる

AMIIモデルは、非言語的行動を改善することで、社会的にインタラクティブなエージェントのコミュニケーションを向上させるんだ。

2025-11-07T08:27:50+00:00 ― 1 分で読む

音声・音声処理連合学習でパーキンソン病の検出を改善する

多言語にわたるパーキンソン病の診断のための音声分析を強化するために、フェデレーテッドラーニングを使う。

2025-11-07T07:39:15+00:00 ― 1 分で読む

計算と言語最新技術を使ってアラビア方言を特定する

この研究は、限られたデータと高度な方法を使ってアラビア語の方言を認識することに焦点を当ててるよ。

2025-11-07T06:02:05+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識マルチモーダルデータ処理の新しいモデル

さまざまなデータタイプを統合して複雑なタスクに対応するモデルを紹介するよ。

2025-11-07T05:13:30+00:00 ― 1 分で読む

サウンド生物音響音響検出の進展

研究者たちが動物の音を自動で検出する方法を改善してるんだ。

2025-11-07T05:03:27+00:00 ― 1 分で読む

音声・音声処理 Whisperの多才な音声認識能力

Whisperがプロンプトエンジニアリングを使って、さまざまなスピーチタスクにどう対応するかを発見しよう。

2025-11-07T04:24:55+00:00 ― 1 分で読む

計算と言語マイノリティ言語の音声認識を改善すること

この研究は、データ技術を使って低リソース言語のASRを向上させる方法を調べてるよ。

2025-11-07T01:59:10+00:00 ― 1 分で読む

音声・音声処理 FastFit: スピーチ生成の新しいアプローチ

FastFitは音質を失うことなく、音声生成の速度を向上させるよ。

2025-11-07T00:22:00+00:00 ― 1 分で読む

音声・音声処理 TACosを使ったキーワードスポッティングの進展

新しい方法が音声録音のキーワード検出を改善する。

2025-11-06T23:33:25+00:00 ― 1 分で読む

音声・音声処理スピーチにおける舌の動きを測定する新しい方法

この研究では、スピーチ中の舌の動きをよりよく測定する方法をX線データを使って紹介してるよ。

2025-11-06T21:56:15+00:00 ― 1 分で読む

サウンド AED-EENDを使ったスピーカーダイアライゼーションの進展

AED-EENDシステムは、より良い精度のために高度な技術を統合してスピーカーダイアリゼーションを強化するよ。

2025-11-06T20:19:05+00:00 ― 1 分で読む

音声・音声処理 Pengi: 音声とテキスト処理の架け橋

Pengiは音声理解とテキスト生成を1つのモデルに統合してるよ。

2025-11-06T19:30:30+00:00 ― 1 分で読む

音声・音声処理遅延ペナルティ付きCTCで音声認識のレイテンシを減らす

新しいアプローチは、音声認識システムの遅延を最小限に抑えつつ、精度を維持しようとしてるよ。

2025-11-06T17:53:20+00:00 ― 1 分で読む

音声・音声処理継続的学習でキーワードスポッティングを進化させる

新しい方法が音声の変化に対応したキーワードスポッティングシステムのパフォーマンスを向上させる。

2025-11-06T17:04:45+00:00 ― 1 分で読む

サウンド多言語テキスト音声変換技術の進歩

新しいTTSシステムが、限られたデータで複数の言語の音声生成を強化するよ。

2025-11-06T13:50:25+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識コンポーザブルディフュージョン：コンテンツ制作の新たな frontier

CoDiは、さまざまな入力から多様なコンテンツタイプを同時に生成できる。

2025-11-06T13:01:50+00:00 ― 1 分で読む

サウンド深層学習を使った音分離の進展

新しい技術がアンビソニックスミックスからの音の分離を改善して、より良いオーディオ体験を提供するよ。

2025-11-06T12:13:15+00:00 ― 1 分で読む

音声・音声処理スピーチモデル圧縮技術の進展

新しい方法が音声モデルを改善しながら、リソースの必要量を減らす。

2025-11-06T11:24:40+00:00 ― 1 分で読む

サウンド音声ベースの健康モニタリングの進展

音声を使った新しい方法が、呼吸パターンや健康状態の特定に期待が持てるって。

2025-11-06T10:36:05+00:00 ― 1 分で読む

サウンド MIDI-Draw: メロディを作る新しい方法

MIDI-Drawを使えば、誰でも直感的にメロディを描いて音楽を作れるよ。

2025-11-06T09:47:30+00:00 ― 1 分で読む

サウンド音質評価のための革新的な方法

画像処理を活用した新しい技術が音質評価を向上させてるよ。

2025-11-06T08:58:55+00:00 ― 1 分で読む

音声・音声処理音声認識の改善：スピードと精度のための新しい技術

新しい方法がスピーチ認識システムの効率をアップさせて、精度を落とさないようにしてるよ。

2025-11-06T08:10:20+00:00 ― 1 分で読む

音声・音声処理視覚データを使った音声処理の進展

新しい方法が音声と視覚的手がかりを使って機械の言葉の理解を向上させている。

2025-11-06T07:21:45+00:00 ― 0 分で読む

音声・音声処理騒がしい環境でのキーワードスポッティングの進展

新しいモデルは、難しい音響環境でのキーワード認識を改善する。

2025-11-06T04:07:25+00:00 ― 1 分で読む

計算と言語 i-Code V2: 混合データ処理の新しいモデル

i-Code V2は、より良いAIの応答のためにビジョン、言語、音声を統合してるよ。

2025-11-06T03:18:50+00:00 ― 1 分で読む

計算と言語知識蒸留でスピーチ理解を向上させる

新しい方法で、テキストモデルから音声モデルに知識を移すことで向上させてる。

2025-11-06T01:41:40+00:00 ― 1 分で読む

音声・音声処理 Coswaraデータセット: COVID-19検出のための革新的なツール

呼吸音の集まりがCOVID-19のケースを特定するのに役立つ。

2025-11-06T00:12:57+00:00 ― 1 分で読む

サウンド ACA-Net: スピーカーバリフィケーションシステムの進化

新しいモデルが効率的な手法でスピーカー認証を向上させる。

2025-11-05T23:15:55+00:00 ― 1 分で読む

サウンド VoxCelebチャレンジのためのスピーカー認識システムの進展

2022年のコンペ用に開発されたスピーカー認識技術の詳しい見解。

2025-11-05T21:38:45+00:00 ― 1 分で読む

音声・音声処理音声と感情の理解を向上させるAI

新しいアプローチがあって、AIが騒がしい環境でのスピーチや感情をもっとよく認識できるように訓練されるんだ。

2025-11-05T17:35:50+00:00 ― 1 分で読む

音声・音声処理家族のふれあいのための革新的な音声分析

新しい方法が家族のダイナミクスや子供のメンタルヘルスの理解を深めることを目指してるよ。

2025-11-05T16:47:15+00:00 ― 1 分で読む