AudioVMAFは、音声品質評価を向上させるために動画の指標を組み合わせてるよ。
― 1 分で読む
最先端の科学をわかりやすく解説
AudioVMAFは、音声品質評価を向上させるために動画の指標を組み合わせてるよ。
― 1 分で読む
最新の記事
最新の記事
研究者たちは、革新的な自己学習技術を使ってパンジャビ語の自動音声認識を向上させた。
― 1 分で読む
新しいモデルは、騒がしい環境でのスピーチ認識を一人の話者に集中させることで改善するよ。
― 1 分で読む
新しい方法が音声監視システムでの発言のプライバシーを守ることを目指している。
― 0 分で読む
新しいデータセットが、テキストに頼らずに感情表現を捉えることで音声合成を強化するんだ。
― 1 分で読む
音のピッチ分類のためのトレーニングの安定性を高める新しい戦略。
― 1 分で読む
フォニームハルシネーターは、限られたデータで音声変換を変えて、よりクリアな出力を実現するよ。
― 1 分で読む
新しい方法で、生の音声データからリアルなジェスチャーを作れるようになった。
― 1 分で読む
研究者たちが、話すタスク中の脳信号をよりよく解釈するためにニューラルラテントアライナーを開発したよ。
― 1 分で読む
グラフェムユニットを使ってバイリンガル音声のためのハイブリッドASRシステムを強化する。
― 1 分で読む
新しいモデルが音声とテキストの整合性を改善して、自動認識をより良くするよ。
― 1 分で読む
Lip2Vecは、少ないラベル付きデータで視覚的スピーチ認識を強化する。
― 1 分で読む
新しい方法が音声認識システムの精度と速度を向上させる。
― 1 分で読む
O-1は自己学習法を最適化することで音声認識を改善する。
― 1 分で読む
新しい手法がテキストデータの統合を通じてASRの性能を向上させる。
― 1 分で読む
テキストインジェクションは、プライバシーを守りつつ個人情報を認識するのに役立つよ。
― 1 分で読む
新しい技術がいろんな応用における音イベント検出をどう変えてるかを発見しよう。
― 1 分で読む
音楽制作や音声分析のための非線形手法を探る。
― 1 分で読む
音楽やサウンドの正確な音程検出のための新しい方法。
― 1 分で読む
Radio2Textは、騒がしい環境でのリアルタイム音声認識にmmWave信号を使ってるよ。
― 1 分で読む
研究が公共スペースにおける自動音マスカーの効果を調べてるよ。
― 1 分で読む
グラフニューラルネットワークは、声のサンプルの関係を分析することでスピーカー認識の精度を向上させる。
― 1 分で読む
6つの言語でのスピーチモデルの感情認識を評価する研究。
― 1 分で読む
AffectEchoモデルはAI生成音声の感情表現を強化するよ。
― 1 分で読む
この研究は、トレーニング中にエラーが起こりやすい部分に注目することでG2Pモデルを強化してるよ。
― 1 分で読む
スピーチ分析のためのフォルマントトラッキングの精度を向上させる方法を見つけよう。
― 1 分で読む
研究者たちが、より正確なパーキンソン病の評価のための音声ベースの方法を開発したよ。
― 1 分で読む
Meta-SELDは、さまざまな環境での音イベントの位置特定を強化するよ。
― 1 分で読む
AVMITは、研究者に音と視覚が動作認識でどう関連するかの洞察を提供します。
― 1 分で読む
新しいAIモデルが音質スコアの予測を強化するよ。
― 1 分で読む
この研究は、サンプリング手法がAI生成音楽の品質にどんな影響を与えるかを調べている。
― 1 分で読む
新しい方法で音声認識システムにおける偽音声の検出が改善されたよ。
― 1 分で読む
新しい方法が複雑なクラシック音楽のビートトラッキング精度を向上させる。
― 1 分で読む
多言語の会話で言語のダイアライゼーションがどう役立つかを見てみよう。
― 1 分で読む
新しいフレームワークは、ラベリングの必要性を減らしてオーディオテクスチャ生成を簡素化する。
― 1 分で読む
新しいシステムが、騒がしい環境での音声認識を高度な技術で改善するよ。
― 1 分で読む
自然な音を失わずに声の匿名化の効果を評価する。
― 1 分で読む
新しいモデルは、音声分類の精度を高め、ノイズや攻撃に対する耐性を強化してるよ。
― 1 分で読む
音楽制作のためのAIツールの概要とそのユニークな機能。
― 1 分で読む
研究は、静止した動画コンテンツに合わせた音声を作成するための深層学習を探求している。
― 1 分で読む
新しい方法で視覚的なヒントを使って音声録音が強化される。
― 0 分で読む