新しいシステムが複数の話者がいる環境でのスピーチの明瞭さを向上させる。
― 1 分で読む
最先端の科学をわかりやすく解説
新しいシステムが複数の話者がいる環境でのスピーチの明瞭さを向上させる。
― 1 分で読む
新しい方法が音声ミックスから声を分離する明瞭さを向上させる。
― 0 分で読む
新しいモデルがバーチャル環境でのリアルな音響体験を向上させる。
― 1 分で読む
新しいデータセットがマルチメディアコンテンツのためのフォーリー音声の作成を改善する。
― 1 分で読む
オンラインスピーカーダイアリゼーションについて学んで、その様々なアプリケーションでの重要性を理解しよう。
― 1 分で読む
新しい手法が、ペアになってないデータとGANを使ってギターアンプのモデリングを改善してるよ。
― 1 分で読む
空間音声変換を導入して、音のリアリズムと没入感を高めます。
― 1 分で読む
新しいシステムが、ロボットが実際のデモからの音声を使ってタスクを学ぶのを助けるんだ。
― 1 分で読む
音声合成で声を作って感情をコントロールする簡単な方法。
― 1 分で読む
高度な深層学習技術を使って音のクリアさを向上させる新しいアプローチ。
― 1 分で読む
革新的な技術がスピーカーのデザインと音の方向性を改善してるよ。
― 0 分で読む
この研究は、高度な手法を使ってディープフェイク音声の検出を改善することに焦点を当ててるよ。
― 1 分で読む
研究は、騒がしい環境でのスピーチ認識を改善するためのビデオの役割を強調している。
― 1 分で読む
音の分類の進歩が音声認識の精度を高めてるよ。
― 1 分で読む
新しいデータセットが詳細なテキスト説明からの音声生成を改善したよ。
― 1 分で読む
新しい方法で、小さいモデルが大きいモデルからのヒントを使ってもっと良くなるんだ。
― 1 分で読む
ElasticASTは重要な詳細を失うことなく、可変長オーディオを効率的に処理できる。
― 1 分で読む
新しいアプローチが、本物と偽物の音声クリップを混ぜたものの検出を改善する。
― 1 分で読む
画像、テキスト、音声を組み合わせた新しいデータセット、インテリアシーンの研究用。
― 1 分で読む
CADEは、進化するスプーフィング脅威に対抗するために継続的学習技術を使って音声検出を強化してるよ。
― 1 分で読む
新しいデータセットは、身体伝導センサーを使って音声キャプチャを改善することを目的としてるよ。
― 1 分で読む
チームがスピーカーと言語識別のための音声処理を改善した。
― 1 分で読む
公開データだけを使った新しいテキストからオーディオへのモデル。
― 1 分で読む
新しい技術が音声録音のイコライゼーションを簡単にしてくれるよ。
― 1 分で読む
デバイスの音質を向上させるための帯域幅拡張技術。
― 1 分で読む
新しい方法が、複数の話者がいる騒がしい環境での音声分離を改善する。
― 1 分で読む
Wavespaceは、より良い音作りとコントロールのための革新的なツールを提供してるよ。
― 1 分で読む
研究は、言語を超えた音声録音の中で、虐待的な発言を特定することに焦点を当てている。
― 1 分で読む
第一人称視点の動画に合った音声を作る方法。
― 1 分で読む
ロス音声圧縮を検出する方法を改善して、音質を良くするための研究。
― 1 分で読む
録音された会話を分析しながらプライバシーを守る技術を調べる。
― 1 分で読む
さまざまなデバイスでより良いオーディオ体験のために、バイノーラル音再生を改善すること。
― 1 分で読む
新しい機械学習モデルが音源分離技術を向上させる。
― 1 分で読む
Music2Latentは、いろんなアプリに合わせて高品質を保ったまま音声圧縮を簡単にしてるよ。
― 1 分で読む
騒がしい環境でのスピーチの明瞭さを向上させるためのスマートグラスを使ったシステム。
― 1 分で読む
音声でヘイトスピーチの瞬間を特定するための新しい技術を使った研究。
― 1 分で読む
PeriodWaveを紹介するよ。音声生成のスピードとクオリティを改善するモデルだ。
― 1 分で読む
PeriodWave-Turboは、いろんなアプリで音の生成速度と品質を向上させるよ。
― 1 分で読む
MAT-SEDは、効果的な音イベント検出のために新しいトランスフォーマーモデルを使ってるよ。
― 1 分で読む
Auptimizeは、XRでのユーザーインタラクションを向上させるために音声キューの配置を強化するよ。
― 1 分で読む