LoopBoxesは子供たちが簡単に協力して音楽を作れるように手助けするよ。
― 1 分で読む
最先端の科学をわかりやすく解説
LoopBoxesは子供たちが簡単に協力して音楽を作れるように手助けするよ。
― 1 分で読む
ニューラルネットワークを使ってリアルな衝撃音を作る新しい方法。
― 1 分で読む
新しい技術で、ASRシステムが非ネイティブアクセントの認識がもっと良くなるよ。
― 1 分で読む
新しい方法はスピーカーのアイデンティティを活用して音声認識のパフォーマンスを向上させる。
― 1 分で読む
新しい方法は、重なり合ったスピーチのために音声認識と話者識別を組み合わせるんだ。
― 1 分で読む
新しい方法がリアルタイム翻訳の質と効率を向上させる。
― 1 分で読む
新しいアプローチで、機械学習が少ない例とマルチモーダルデータで強化される。
― 1 分で読む
複雑な音環境での部屋の反応を推定する新しい方法。
― 1 分で読む
音声変換の新しい方法が明瞭さと適応性を向上させたよ。
― 1 分で読む
カザフのデータを使ってあまり知られていないトルコ語系の言語のTTSシステムを作ってるんだ。
― 1 分で読む
MeLoDyは、テキストプロンプトから高品質な音楽をすぐに生成するよ。
― 1 分で読む
新しい方法が出てきて、音声認識を敵対的攻撃から守るようになったよ。
― 1 分で読む
AudioDecは低データ使用でリアルタイムの高品質オーディオを提供してるよ。
― 1 分で読む
拡散モデルのトレーニングデータの露出をチェックする新しい手法。
― 1 分で読む
新しいモデルは、騒がしい環境での声の隔離を改善する。
― 1 分で読む
この記事では、デジタル技術を使って磁気テープの音を再現する方法について話してるよ。
― 1 分で読む
新しいフレームワークが音声合成の音声生成品質を向上させたよ。
― 1 分で読む
研究者たちが、話すのに困難がある人のためにユニークな声を再現する技術を開発した。
― 0 分で読む
新しい方法で、知識蒸留とファインチューニングを組み合わせてスピーカー認証を強化するんだ。
― 1 分で読む
DeCoRは、機械が古い音を忘れずに新しい音を学ぶのを助けるんだ。
― 1 分で読む
ストリーミングオーディオトランスフォーマーは、オーディオタグ付けシステムの速度と効率を向上させる。
― 1 分で読む
新しい技術が音声をテキストに変換する精度と速度を向上させてるよ。
― 1 分で読む
この研究は、構音障害のある人たちがより明確にコミュニケーションできるように、改善された評価方法を紹介しているよ。
― 1 分で読む
新しい方法で、似たような音の名前の音声認識が向上した。
― 1 分で読む
新しい方法がテキスト読み上げの自然さとバリエーションを向上させるよ。
― 1 分で読む
Treffアダプターは、ラベル付きデータが限られた状態で音声分類を改善する。
― 1 分で読む
新しい方法が音声タスクでモデルの柔軟性とパフォーマンスを向上させる。
― 1 分で読む
研究は、埋め込みを使ってスピーチの感情を認識する効果的な方法を強調している。
― 1 分で読む
E-PANNsが音声認識の効率をどう向上させるかを見つけよう。
― 1 分で読む
この研究は音声録音を使って方言を分析し、その類似点を明らかにしてるよ。
― 0 分で読む
新しい方法が、書き起こしなしで話し言葉の理解を向上させる。
― 1 分で読む
新しい音を効率的に学ぶことで、音声分類を強化する新しい方法が登場した。
― 1 分で読む
新しい方法で、最小限のデータでTTSの適応が改善される。
― 1 分で読む
自動音声認識における説明可能なAI手法の概要。
― 1 分で読む
新しいモデルが機械が音声質問を理解して応答する方法を改善した。
― 1 分で読む
研究でTTS技術のターンテイキングを改善する必要があるって指摘されてるよ。
― 1 分で読む
BabySLMは、機械が子供の言葉を基にして音声を理解する能力を評価するんだ。
― 1 分で読む
新しい方法が合成音声の選択を改善して、ASRシステムの精度を向上させるよ。
― 1 分で読む
新しい方法が、不流暢な話し言葉をテキストと効率的に合わせるよ。
― 1 分で読む
新しい技術でサイレントスピーチ認識システムを改善する。
― 1 分で読む