EnCodecMAEは、自己教師あり学習とオーディオコーデックを組み合わせて、オーディオタスクのパフォーマンスを向上させるんだ。
― 1 分で読む
最先端の科学をわかりやすく解説
EnCodecMAEは、自己教師あり学習とオーディオコーデックを組み合わせて、オーディオタスクのパフォーマンスを向上させるんだ。
― 1 分で読む
ASD評価のために子どもの音を識別するのに機械学習を使う研究。
― 1 分で読む
言語を超えてスピーチのキーワードを認識する柔軟な方法を紹介します。
― 1 分で読む
クラウドソーシングを使ってスピーチの品質がどうテストされるかの見てみよう。
― 0 分で読む
音声クローンの時代における音声の信頼性を確保するための先進的な技術。
― 1 分で読む
新しい方法が音声キャプションシステムをテキストの説明だけでトレーニングするんだ。
― 1 分で読む
明確で効果的な学術論文を書くためのガイド。
― 1 分で読む
Erieはデータを音に変えるのを簡単にして、もっとアクセスしやすくしてるよ。
― 1 分で読む
スピーカー認証システムに対するバックドア攻撃のリスクを調べる。
― 1 分で読む
新しい方法が詳細なラベルなしで音声と映像のセグメンテーションを向上させる。
― 1 分で読む
PIAVEは、話し手が顔を背けても機械が声をクリアに抽出するのを助けるよ。
― 1 分で読む
Libriheavyは、音声認識技術を向上させるために5万時間の英語音声を提供してるよ。
― 1 分で読む
AV2Wavは音声と視覚のヒントを使ってスピーチの質を向上させるんだ。
― 1 分で読む
機械が自然に話しの感情を変える新しい方法。
― 1 分で読む
音楽業界でディープフェイクの歌声を見分ける新しい方法が開発されてるよ。
― 1 分で読む
コアセット選択は、さまざまなデータに焦点を当てることで、テキスト読み上げモデルを改善するよ。
― 1 分で読む
新しいモデルが、スピーチの感情分析のやり方を変えてるね。
― 1 分で読む
新しい方法は、プライバシーを守りながら行動を認識するために超音波を使ってるよ。
― 1 分で読む
音声プライバシー研究を強化するための柔軟なフレームワークを紹介します。
― 1 分で読む
CiwaGANは、スピーチの動きのコントロールと情報共有を組み合わせて、より良いスピーチ学習を実現します。
― 1 分で読む
言葉と非言語的ヒントを組み合わせて、もっと良い言語学習をするためのフレームワーク。
― 1 分で読む
新しい方法がスピーチ分類モデルの理解を簡単にするよ。
― 1 分で読む
新しいシステムは、母国語の影響を考慮して発音スキルを向上させるんだ。
― 1 分で読む
量子ツールが音楽制作やパフォーマンスをどう変えるかを見てみよう。
― 1 分で読む
新しい方法が音声変換プロセスで感情の保持を改善した。
― 1 分で読む
新しい方法で声の変換における感情のトーンが守られて、より良い人間とコンピュータのインタラクションが実現するよ。
― 1 分で読む
新しいシステムは、仲介なしでテキストから音声言語への翻訳を改善するよ。
― 1 分で読む
研究者たちは、コーデックデータ拡張手法を使って心音分類の精度を向上させた。
― 1 分で読む
研究によると、感情のある話し方がスピーチ分離タスクのモデルパフォーマンスに影響を与えるって。
― 1 分で読む
M-AUDIODECは、スピーカーの位置と音質を保ちながらマルチチャネルオーディオを圧縮するよ。
― 1 分で読む
S2STの新しい方法は、話者のアイデンティティを保ちながら翻訳品質を向上させるよ。
― 1 分で読む
新しいシステムが空間オーディオの圧縮を強化して、よりクリアな音と効率を実現する。
― 1 分で読む
音楽と言語をつなげて理解を深める新しいシステム。
― 1 分で読む
研究がスマートイヤフォンの音声クリアさを高める新しいモデルを明らかにした。
― 0 分で読む
追加情報を使うと、鳥の鳴き声を識別する能力がアップするよ。
― 1 分で読む
新しいアプローチで、音声をテキストの説明に合わせて生成するのが進化したよ。
― 1 分で読む
研究者たちは、構造化状態空間モデルを使ってオンライン音声認識を改善するために取り組んでいる。
― 1 分で読む
新しいシステムがリアルタイムで話者を特定して、会議の体験を向上させるよ。
― 0 分で読む
新しい方法が、偽のスピーチを効果的に検出する能力を向上させてるよ。
― 1 分で読む
プライバシーとスピーチの質を向上させる声変換の方法。
― 1 分で読む