高度な音声認識技術を使って医者と患者のコミュニケーションを改善する。
― 1 分で読む
最先端の科学をわかりやすく解説
高度な音声認識技術を使って医者と患者のコミュニケーションを改善する。
― 1 分で読む
Synthiaのメロディーは、研究者がさまざまなデータに対して音声モデルのテストをするのを手助けしてるよ。
― 1 分で読む
研究は、セグメント化されていない音声のためのASRシステムの改善に焦点を当てている。
― 1 分で読む
研究は、さまざまなメディアでの人間の声のためのシンセサイザーの最適化に焦点を当てている。
― 1 分で読む
新しい方法がセッションのばらつきをうまく管理することで、スピーカーバリデーションを改善するよ。
― 1 分で読む
LLMは音声認識システムの精度とエラー修正を向上させるんだ。
― 1 分で読む
新しい方法が、ラベルなしで音の認識と音源の特定を向上させる。
― 1 分で読む
言語モデルを使ってASR精度を向上させる新しいベンチマーク。
― 1 分で読む
新しい方法は文脈情報に注目して音声翻訳を改善する。
― 1 分で読む
新しい方法でコードスイッチングユーザーの音声認識が改善されたよ。
― 1 分で読む
音の分析が機械の問題を効率的に特定するのにどう役立つかを学ぼう。
― 1 分で読む
このプロジェクトはリアルタイムの音声翻訳と自動字幕システムを強化するんだ。
― 1 分で読む
ミニマの鋭さが未見の音声データに対するモデルのパフォーマンスにどう影響するかを探る。
― 1 分で読む
新しい手法が音声と映像データを統合してスピーカー認証を改善したよ。
― 0 分で読む
トランスフォーマーを使った音楽タグ付けと表現の効果的な研究。
― 1 分で読む
音声と視覚データを使ってスピーカートラッキングを強化する新しい方法。
― 1 分で読む
楽譜の画像を使ってピアノの音楽の難しさを評価する新しいアプローチ。
― 1 分で読む
PP-MeTは、複数の話者がいる会議の文字起こしの精度を向上させることを目指しているよ。
― 1 分で読む
この研究は、いろんな条件でスピーチの明瞭さを改善するモデルを提示してるよ。
― 1 分で読む
自動音声キャプションの進歩とそのアクセシビリティへの影響を探る。
― 1 分で読む
研究が騒がしい環境でのスピーチの明瞭さを改善する効果的な方法を紹介してるよ。
― 1 分で読む
新しい方法が、微分不可能なエフェクトを使ってオーディオスタイル転送を簡素化する。
― 1 分で読む
研究は、リスニングテストを通じてコンピュータ音楽と人間の演奏の比較を調べている。
― 0 分で読む
ウルトラスフィアポリノミアルが音響技術や音の方向性をどう改善するか学ぼう。
― 1 分で読む
新しい方法が、少ないラベルとリソースで音声認識を改善する。
― 1 分で読む
新しい方法でテキストの説明を音のイベントにリンクさせるのがもっと簡単になったよ。
― 1 分で読む
革新的な方法が、ロボットが動いている間の音の方向処理を改善する。
― 0 分で読む
実数値ビームフォーミングとそれがマイクロフォンアレイに与えるメリットを学ぼう。
― 1 分で読む
MusicAOGは、革新的なグラフ表現を通じて音楽の制作と理解を簡単にするよ。
― 1 分で読む
音響研究における球面マイクロフォンとスピーカーアレイを組み合わせる新しいフレームワーク。
― 1 分で読む
マイクロフォンアレイ設計を通じて、人型ロボットの音検出を改善するための新しいフレームワーク。
― 1 分で読む
MIMOシステムがいろんな環境で音の分析をどう良くするか発見しよう。
― 1 分で読む
新しい技術が音の方向推定をいろんな音響環境で改善してるよ。
― 1 分で読む
研究によると、部屋の音の振る舞いを調整して明瞭さを向上させる方法がわかったよ。
― 1 分で読む
新しいモデルがビデオの面白い瞬間を視覚、音声、テキストデータを使って特定するんだ。
― 1 分で読む
電気エラスマーは電気エネルギーを機械的動きに変換して、いろんな用途があるんだ。
― 1 分で読む
誤りのあるASRトランスクリプトは、アルツハイマーをもっと正確に特定するのに役立つ。
― 1 分で読む
ELLA-Vはテキスト読み上げの品質とコントロールを向上させて、以前のモデルを超えたよ。
― 1 分で読む
新しいアプローチで動物の鳴き声検出精度が、恣意的な閾値なしで向上したよ。
― 1 分で読む
新しいモデルは、音声とテキストを統合して、より良いスピーチ分類を実現してるよ。
― 1 分で読む