研究によると、モーフサンプルを使った音声認識には深刻な脅威があるみたい。
― 1 分で読む
最先端の科学をわかりやすく解説
研究によると、モーフサンプルを使った音声認識には深刻な脅威があるみたい。
― 1 分で読む
モーツァルトのソナタとピアノ演奏、専門家の注釈を組み合わせた詳細なデータセット。
― 1 分で読む
新しい軽量モデルが自己教師あり学習技術を使って音程の推定を改善する。
― 1 分で読む
音楽のセグメント識別と分析を改善する新しいアプローチ。
― 1 分で読む
増え続ける懸念の中で偽の曲を特定するための新しい方法が開発された。
― 1 分で読む
Cleancoderは、背景ノイズを減らして音声理解をよりクリアにすることでASRシステムを向上させるんだ。
― 1 分で読む
RADIOは、たった一枚の参照画像からリアルな話す顔を作り出す。
― 1 分で読む
RoDiaはルーマニアの方言を特定するための重要な音声サンプルを提供してるよ。
― 1 分で読む
ジェスチャーや表情が話し言葉の理解をどう深めるか探ってるんだ。
― 0 分で読む
合成データを使って音の検出と位置特定の新しい方法を探ってる。
― 1 分で読む
新しいシステムが音楽家に仮想ステージで音を体験させるよ。
― 0 分で読む
新しい方法が録音内の偽音声セグメントの検出を向上させた。
― 1 分で読む
コンピュータが音楽のリズムとハーモニーを分けることを学んでるんだって、クリエイティブな応用のために。
― 1 分で読む
マイクロソフトのMuLanTTSは、自然で表現力豊かなフランス語のテキスト読み上げ機能を提供してるよ。
― 1 分で読む
新しいデータセットと手法で車両分類が改善されて、交通管理がもっと良くなるよ。
― 1 分で読む
新しい方法が音声認識技術の精度と速度を向上させる。
― 1 分で読む
新しいシンセサイザーがメディアのリアルな音効の生成を改善するよ。
― 1 分で読む
新しいアプローチがASRシステムの自信推定を強化して、精度を向上させる。
― 1 分で読む
より自然で表現力豊かな音声合成のためのフレームワークを紹介。
― 1 分で読む
テクノロジーが音楽ジャンルを効率よくカテゴライズするのにどう役立つかを学ぼう。
― 1 分で読む
音声と映像データを使って魚の食事を評価する統一的なアプローチ。
― 1 分で読む
新しい方法が感情豊かなトーキングヘッド動画の制作を改善したよ。
― 1 分で読む
この研究は、オーディオフィルターバンク作成におけるコンボリューショナルネットワーク(convnet)の使用に関する問題を探っているよ。
― 1 分で読む
CLAPモデルは、さまざまなアプリケーションのために音声とテキスト処理をつなげるよ。
― 1 分で読む
プロジェクトは自己教師あり学習を使ってフランス語の音声処理を改善することを目指してる。
― 1 分で読む
新しい方法で、機械がスピーチのリズムや感情を認識するのが改善されてる。
― 1 分で読む
新しいアプローチで、散乱物体がある空間での音の推定が改善されたよ。
― 0 分で読む
undecidabilityが今の音楽作曲や制作にどんな影響を与えてるかを探る。
― 1 分で読む
この記事では、より高い精度を目指したスピーカーダイアライゼーションの進展について言語モデルを使って探ります。
― 1 分で読む
この研究は、ASRシステムが子供の話す言葉を認識する能力を向上させる。
― 1 分で読む
研究者たちは、都市部での歩行者検出を改善するための音声センサーテクノロジーを探っている。
― 1 分で読む
新しい手法で音源の定位とフィールドの分離が向上した。
― 1 分で読む
新しい手法が、シャープなトランジェント要素に焦点を当てることでドラムサウンドの合成を改善する。
― 1 分で読む
研究者たちは音声認識でプライバシーを守るために合成音声データを開発中です。
― 1 分で読む
VoxtLMは、音声認識、合成、テキスト生成、そして継続を1つのモデルにまとめているよ。
― 1 分で読む
新しいシステムは文脈に応じたプロンプトを使って音声認識を強化するよ。
― 1 分で読む
EnCodecMAEは、自己教師あり学習とオーディオコーデックを組み合わせて、オーディオタスクのパフォーマンスを向上させるんだ。
― 1 分で読む
ASD評価のために子どもの音を識別するのに機械学習を使う研究。
― 1 分で読む
言語を超えてスピーチのキーワードを認識する柔軟な方法を紹介します。
― 1 分で読む
クラウドソーシングを使ってスピーチの品質がどうテストされるかの見てみよう。
― 0 分で読む