新しい方法が長い録音の音声認識を改善する。
― 1 分で読む
最先端の科学をわかりやすく解説
新しい方法が長い録音の音声認識を改善する。
― 1 分で読む
この研究は、音声認識において音声、動画、テキストがどうやって一緒に機能するかを分析している。
― 0 分で読む
新しいモデルは音声合成システムの自然さを改善するためにピッチパターンを分析するんだ。
― 1 分で読む
新しいモデルがアフリカの言語の音声表現を強化して、テクノロジーの包摂性を向上させる。
― 1 分で読む
新しいモデルがメロディとテキストの説明を使って音楽制作を改善するよ。
― 1 分で読む
新しいスピーチ言語モデルの方法は、大量のデータの必要性を減らす。
― 1 分で読む
音声変換の仕組みとそのワクワクする応用を学ぼう。
― 1 分で読む
CCIがマルチメディアの品質評価をどう改善するかを発見しよう。
― 1 分で読む
研究者たちは、音声と視覚の手がかりを組み合わせて、より正確に嘘を見抜く方法を探ってるんだ。
― 1 分で読む
緊急時の言語の壁を克服するための新しい音声ベースのネットワークができたんだ。
― 1 分で読む
バーチャルアシスタントがユーザーの命令をどうやってもっとよく理解するか学ぼう。
― 1 分で読む
MACEは音を正確なテキスト説明にリンクさせることで音声キャプショニングを改善する。
― 1 分で読む
機械学習を使って、曲カバーへの観客の反応を予測する。
― 1 分で読む
角距離分布損失を通じて分類を強化する新しいアプローチ。
― 1 分で読む
新しい方法が、言語障害のある人のためのコミュニケーションツールを改善してるよ。
― 1 分で読む
言語モデルを使った新しい手法が、バックグラウンドノイズの中での音の検出を強化してるよ。
― 1 分で読む
Fish-Speechは、もっと自然なコミュニケーション体験のために声の技術を向上させるよ。
― 1 分で読む
EmoSphere++は、機械が人間みたいに感情を表現できるようにして、やり取りを良くするんだ。
― 1 分で読む
U-COTANSは深層学習技術を使って水中境界の検出を改善する。
― 1 分で読む
PIASTは研究者のためにユニークなピアノ音楽のコレクションを提供してるよ。
― 1 分で読む
機械は3D空間で音と映像をつなげる方法を学ぶ。
― 1 分で読む
新しい手法が音声録音におけるスピーカーの識別をどのように変えているか。
― 1 分で読む
研究者たちは、話しているときの舌の動きを可視化するためにテクノロジーを使っているんだ。
― 1 分で読む
Align-SLMがコンピュータ音声生成をどう変えてるか探ってみて。
― 1 分で読む
TSEが混雑した環境でテキストキューを使って音声認識を改善する方法を学ぼう。
― 1 分で読む
新しいシステムが叫び声を検知して、建設現場の作業員の安全を向上させるんだって。
― 1 分で読む
高度なモデルを使って、スピーチの感情認識の新しい方法を探ってる。
― 1 分で読む
新しいアプローチでバックグラウンドノイズを考慮してスピーチ品質評価が向上したよ。
― 1 分で読む
音声サンプルを合成して音楽クリエイターが簡単に革新できる新しいシステム。
― 1 分で読む
ダイナミックレンジ圧縮が音の体験をどう良くするかを見てみよう。
― 1 分で読む
音声アシスタントは高齢者の記憶の問題の初期兆候を特定するのに役立つよ。
― 1 分で読む
システムはテーブルトークRPGの物語に基づいてリアルタイムで音楽を作るんだ。
― 1 分で読む
SLAM-ASRの強み、弱み、そして音声認識における未来を調べる。
― 1 分で読む
音場画像を明確にし、可視化する新しい方法。
― 1 分で読む
プロジェクトは、タミルのリソースを使ってマラサール語の音声認識を改善するよ。
― 1 分で読む
研究者たちは、統合失調症のメンタルヘルス評価を改善するためにスピーチを探求している。
― 0 分で読む
ミュージシャンがどんだけ科学モデルとタイミングを合わせるか学ぼう。
― 0 分で読む
NeKoは、話し言葉、翻訳、テキストのエラーを修正することで機械間のコミュニケーションを強化するよ。
― 1 分で読む
音が音響ボリュームレンダリングを通じてバーチャル体験をどう豊かにするか発見しよう。
― 1 分で読む
この研究では、音の分析を使ってマシンの故障を効果的に特定してるよ。
― 1 分で読む