新しい技術がいろんな応用における音イベント検出をどう変えてるかを発見しよう。
― 1 分で読む
最先端の科学をわかりやすく解説
新しい技術がいろんな応用における音イベント検出をどう変えてるかを発見しよう。
― 1 分で読む
音楽制作や音声分析のための非線形手法を探る。
― 1 分で読む
音楽やサウンドの正確な音程検出のための新しい方法。
― 1 分で読む
Radio2Textは、騒がしい環境でのリアルタイム音声認識にmmWave信号を使ってるよ。
― 1 分で読む
研究が公共スペースにおける自動音マスカーの効果を調べてるよ。
― 1 分で読む
グラフニューラルネットワークは、声のサンプルの関係を分析することでスピーカー認識の精度を向上させる。
― 1 分で読む
6つの言語でのスピーチモデルの感情認識を評価する研究。
― 1 分で読む
AffectEchoモデルはAI生成音声の感情表現を強化するよ。
― 1 分で読む
この研究は、トレーニング中にエラーが起こりやすい部分に注目することでG2Pモデルを強化してるよ。
― 1 分で読む
スピーチ分析のためのフォルマントトラッキングの精度を向上させる方法を見つけよう。
― 1 分で読む
研究者たちが、より正確なパーキンソン病の評価のための音声ベースの方法を開発したよ。
― 1 分で読む
Meta-SELDは、さまざまな環境での音イベントの位置特定を強化するよ。
― 1 分で読む
AVMITは、研究者に音と視覚が動作認識でどう関連するかの洞察を提供します。
― 1 分で読む
新しいAIモデルが音質スコアの予測を強化するよ。
― 1 分で読む
この研究は、サンプリング手法がAI生成音楽の品質にどんな影響を与えるかを調べている。
― 1 分で読む
新しい方法で音声認識システムにおける偽音声の検出が改善されたよ。
― 1 分で読む
新しい方法が複雑なクラシック音楽のビートトラッキング精度を向上させる。
― 1 分で読む
多言語の会話で言語のダイアライゼーションがどう役立つかを見てみよう。
― 1 分で読む
新しいフレームワークは、ラベリングの必要性を減らしてオーディオテクスチャ生成を簡素化する。
― 1 分で読む
新しいシステムが、騒がしい環境での音声認識を高度な技術で改善するよ。
― 1 分で読む
自然な音を失わずに声の匿名化の効果を評価する。
― 1 分で読む
新しいモデルは、音声分類の精度を高め、ノイズや攻撃に対する耐性を強化してるよ。
― 1 分で読む
音楽制作のためのAIツールの概要とそのユニークな機能。
― 1 分で読む
研究は、静止した動画コンテンツに合わせた音声を作成するための深層学習を探求している。
― 1 分で読む
新しい方法で視覚的なヒントを使って音声録音が強化される。
― 0 分で読む
オンラインミーティングでの音声品質評価を向上させるXLS-Rモデルの見方。
― 1 分で読む
新しい方法で音声タグ付けのパフォーマンスと効率が向上したよ。
― 1 分で読む
研究はAIによって作られたフェイク音声のリアルタイム検出方法を強調している。
― 1 分で読む
Whombatは野生動物研究のための音声録音注釈を効率化するよ。
― 1 分で読む
新しい戦略が、騒がしい環境での話し言葉の明瞭さを向上させ、認識を良くするよ。
― 1 分で読む
感情的な画像を音楽に結びつけて、発見をより良くする新しいシステムができたよ。
― 1 分で読む
新しいシステムが音声録音を改善して、より良いリスニング体験を提供するよ。
― 1 分で読む
新しいアプローチがデータのラベリングを減らしつつ、音声分類の精度を高める。
― 1 分で読む
新しいシステムが段落合成の音質と表現力を向上させるよ。
― 1 分で読む
AIが作った音楽の質を主観的・客観的に評価する方法を見つけよう。
― 1 分で読む
研究は、スピーチセラピーや言語学習を助けるための舌の動きに焦点を当てている。
― 1 分で読む
この研究は、性別が声のバイオメトリクスの有用性、プライバシー、そして公平性にどう影響するかを調べてるよ。
― 1 分で読む
新しい剪定方法がゼロショット多話者テキスト音声合成モデルのパフォーマンスを向上させる。
― 1 分で読む
緊急通報のやり取りにおける感情認識の研究は、重要な知見を明らかにしてるよ。
― 1 分で読む
スピーチデータを選ぶ新しい方法は、ラベリングを最小限に抑えつつ、認識精度を向上させる。
― 1 分で読む