バーチャルエージェントは、人間のジェスチャーを真似ることで、より良いインタラクションを学んでる。
― 1 分で読む
最先端の科学をわかりやすく解説
バーチャルエージェントは、人間のジェスチャーを真似ることで、より良いインタラクションを学んでる。
― 1 分で読む
ミュージシャンにメリットがあるシンセサイザーを作る新しい方法。
― 1 分で読む
新しいフレームワークが音声と映像の手がかりを使ってアクティブスピーカーの検出を改善する。
― 1 分で読む
自動スピーカ認証システムの課題と防御策を見てみよう。
― 1 分で読む
光ネットワークは速いデータ転送を可能にして、コミュニケーション技術の未来を形作ってるんだ。
― 1 分で読む
新しい方法が一般的な音声モデルを強化して、効果的な音声認識を実現する。
― 1 分で読む
新しいモデルは対話の感情理解を向上させる。
― 1 分で読む
モデルは話し言葉とテキストを組み合わせて翻訳精度を向上させる。
― 1 分で読む
研究では、人間の音声モデルを使ってマーモセットの声を効果的に分析してるよ。
― 1 分で読む
新しい方法で音データを使って呼吸器疾患の早期発見が改善されたよ。
― 1 分で読む
この研究は、笑いが音の分析を通じて感情をどう伝えるかを調べてるよ。
― 1 分で読む
新しいモデルがインターネットなしでデバイスに音声機能をもたらす。
― 1 分で読む
新しいモデルZET-Speechが多様な話者のための感情的な音声合成を強化しました。
― 1 分で読む
研究によると、新しいミキシング技術が音楽のトランスクリプション精度を向上させることがわかった。
― 1 分で読む
新しい方法が、より良い感情理解を通じて機械の反応を向上させる。
― 1 分で読む
新しい方法が会議の音声認識の精度を向上させる。
― 1 分で読む
CALLSは、音声アシスタントが顧客とのやり取りをうまく処理できるようにすることを目指してる。
― 1 分で読む
新しい方法が音声の修復と制作品質を向上させてるよ。
― 1 分で読む
PLCMOSは、人間のリスナーなしでスピーチの品質を評価する新しい方法を提供してるよ。
― 1 分で読む
LoopBoxesは子供たちが簡単に協力して音楽を作れるように手助けするよ。
― 1 分で読む
ニューラルネットワークを使ってリアルな衝撃音を作る新しい方法。
― 1 分で読む
新しい技術で、ASRシステムが非ネイティブアクセントの認識がもっと良くなるよ。
― 1 分で読む
新しい方法はスピーカーのアイデンティティを活用して音声認識のパフォーマンスを向上させる。
― 1 分で読む
新しい方法は、重なり合ったスピーチのために音声認識と話者識別を組み合わせるんだ。
― 1 分で読む
新しい方法がリアルタイム翻訳の質と効率を向上させる。
― 1 分で読む
複雑な音環境での部屋の反応を推定する新しい方法。
― 1 分で読む
音声変換の新しい方法が明瞭さと適応性を向上させたよ。
― 1 分で読む
MeLoDyは、テキストプロンプトから高品質な音楽をすぐに生成するよ。
― 1 分で読む
新しい方法が出てきて、音声認識を敵対的攻撃から守るようになったよ。
― 1 分で読む
拡散モデルのトレーニングデータの露出をチェックする新しい手法。
― 1 分で読む
新しいモデルは、騒がしい環境での声の隔離を改善する。
― 1 分で読む
この記事では、デジタル技術を使って磁気テープの音を再現する方法について話してるよ。
― 1 分で読む
新しい方法で、知識蒸留とファインチューニングを組み合わせてスピーカー認証を強化するんだ。
― 1 分で読む
DeCoRは、機械が古い音を忘れずに新しい音を学ぶのを助けるんだ。
― 1 分で読む
ストリーミングオーディオトランスフォーマーは、オーディオタグ付けシステムの速度と効率を向上させる。
― 1 分で読む
新しい技術が音声をテキストに変換する精度と速度を向上させてるよ。
― 1 分で読む
この研究は、構音障害のある人たちがより明確にコミュニケーションできるように、改善された評価方法を紹介しているよ。
― 1 分で読む
新しい方法で、似たような音の名前の音声認識が向上した。
― 1 分で読む
新しい方法がテキスト読み上げの自然さとバリエーションを向上させるよ。
― 1 分で読む
Treffアダプターは、ラベル付きデータが限られた状態で音声分類を改善する。
― 1 分で読む