この記事は、音声特徴を使って電話の分類を強化する方法について話してるよ。
― 1 分で読む
最先端の科学をわかりやすく解説
この記事は、音声特徴を使って電話の分類を強化する方法について話してるよ。
― 1 分で読む
新しいモデルがAIの音声認識と推論能力を向上させる。
― 1 分で読む
NASSは騒がしい環境での声の隔離を改善して、従来の方法よりも優れてるよ。
― 1 分で読む
合成音声作成のための音質向上の新しいアプローチ。
― 1 分で読む
新しい技術が音声認識の効率を向上させ、ラベリングコストを削減する。
― 1 分で読む
新しいラウドネス計算方法を使って音質メトリクスを向上させる。
― 1 分で読む
AlignAttは、同時スピーチ翻訳の速度と品質を向上させます。
― 1 分で読む
新しい方法で、性能を犠牲にせずにスピーチ分類のプライバシーが確保される。
― 1 分で読む
この研究は、さまざまなアクセントにTTS技術を効率的に適応させる方法を示してるよ。
― 1 分で読む
AMIIモデルは、非言語的行動を改善することで、社会的にインタラクティブなエージェントのコミュニケーションを向上させるんだ。
― 1 分で読む
多言語にわたるパーキンソン病の診断のための音声分析を強化するために、フェデレーテッドラーニングを使う。
― 1 分で読む
この研究は、限られたデータと高度な方法を使ってアラビア語の方言を認識することに焦点を当ててるよ。
― 1 分で読む
さまざまなデータタイプを統合して複雑なタスクに対応するモデルを紹介するよ。
― 1 分で読む
研究者たちが動物の音を自動で検出する方法を改善してるんだ。
― 1 分で読む
Whisperがプロンプトエンジニアリングを使って、さまざまなスピーチタスクにどう対応するかを発見しよう。
― 1 分で読む
この研究は、データ技術を使って低リソース言語のASRを向上させる方法を調べてるよ。
― 1 分で読む
FastFitは音質を失うことなく、音声生成の速度を向上させるよ。
― 1 分で読む
新しい方法が音声録音のキーワード検出を改善する。
― 1 分で読む
この研究では、スピーチ中の舌の動きをよりよく測定する方法をX線データを使って紹介してるよ。
― 1 分で読む
AED-EENDシステムは、より良い精度のために高度な技術を統合してスピーカーダイアリゼーションを強化するよ。
― 1 分で読む
Pengiは音声理解とテキスト生成を1つのモデルに統合してるよ。
― 1 分で読む
新しいアプローチは、音声認識システムの遅延を最小限に抑えつつ、精度を維持しようとしてるよ。
― 1 分で読む
新しい方法が音声の変化に対応したキーワードスポッティングシステムのパフォーマンスを向上させる。
― 1 分で読む
新しいTTSシステムが、限られたデータで複数の言語の音声生成を強化するよ。
― 1 分で読む
CoDiは、さまざまな入力から多様なコンテンツタイプを同時に生成できる。
― 1 分で読む
新しい技術がアンビソニックスミックスからの音の分離を改善して、より良いオーディオ体験を提供するよ。
― 1 分で読む
新しい方法が音声モデルを改善しながら、リソースの必要量を減らす。
― 1 分で読む
音声を使った新しい方法が、呼吸パターンや健康状態の特定に期待が持てるって。
― 1 分で読む
MIDI-Drawを使えば、誰でも直感的にメロディを描いて音楽を作れるよ。
― 1 分で読む
画像処理を活用した新しい技術が音質評価を向上させてるよ。
― 1 分で読む
新しい方法がスピーチ認識システムの効率をアップさせて、精度を落とさないようにしてるよ。
― 1 分で読む
新しい方法が音声と視覚的手がかりを使って機械の言葉の理解を向上させている。
― 0 分で読む
新しいモデルは、難しい音響環境でのキーワード認識を改善する。
― 1 分で読む
i-Code V2は、より良いAIの応答のためにビジョン、言語、音声を統合してるよ。
― 1 分で読む
新しい方法で、テキストモデルから音声モデルに知識を移すことで向上させてる。
― 1 分で読む
呼吸音の集まりがCOVID-19のケースを特定するのに役立つ。
― 1 分で読む
新しいモデルが効率的な手法でスピーカー認証を向上させる。
― 1 分で読む
2022年のコンペ用に開発されたスピーカー認識技術の詳しい見解。
― 1 分で読む
新しいアプローチがあって、AIが騒がしい環境でのスピーチや感情をもっとよく認識できるように訓練されるんだ。
― 1 分で読む
新しい方法が家族のダイナミクスや子供のメンタルヘルスの理解を深めることを目指してるよ。
― 1 分で読む