この研究は、ノイズの多い音声から正確な医療用語を捉えることの課題を扱ってる。
― 1 分で読む
最先端の科学をわかりやすく解説
この研究は、ノイズの多い音声から正確な医療用語を捉えることの課題を扱ってる。
― 1 分で読む
新しい方法が音響情報を言語モデルに統合して、もっと良い音声認識を実現するんだ。
― 1 分で読む
LLMは医療のトランスクリプションの精度を向上させて、患者ケアに役立ってるよ。
― 1 分で読む
さまざまなアプリケーションでオーディオコーデックのパフォーマンスを評価する新しいシステム。
― 1 分で読む
ASRの概要と現代アプリケーションにおける進展。
― 1 分で読む
AIは、難しい環境でもより良い聴覚とコミュニケーションのために人工内耳を改善しているよ。
― 1 分で読む
新しい方法が、全録音を使ってスピーチ評価を改善する。
― 1 分で読む
音声タスクにおける基盤モデルを評価するための新しいフレームワーク。
― 1 分で読む
新しい方法が直接字幕を作成して、さまざまな視聴者のアクセシビリティを向上させる。
― 1 分で読む
この研究は、吃音のある人たちとのASRシステムのパフォーマンスを評価してるよ。
― 1 分で読む
ユニバーサルオーディオクリップは、Whisperみたいな高度なASRモデルをミュートできる。
― 1 分で読む
先進的なトレーニング技術を使った教室向けの音声認識の向上が学習を改善する。
― 1 分で読む
新モデルVPIDMは騒がしい環境での音声の明瞭さを向上させる。
― 1 分で読む
新しいモデルは、複数のデコード方法を使って音声認識を向上させてる。
― 1 分で読む
mHuBERT-147は、多言語の音声を効率的に処理するよ。
― 1 分で読む
科学的なプレゼンテーションの文字起こし精度を音声とビジュアルの統合で向上させる。
― 1 分で読む
ナイジェリア英語を翻訳して、ノリウッド映画のアクセス性を高める研究。
― 1 分で読む
新しいモデルが大規模言語モデルを使って音声からテキストへの翻訳を改善したよ。
― 1 分で読む
プライバシーを確保するために、9言語の話者匿名化技術を改善中。
― 1 分で読む
新しい方法で、特定のコードブックを使ってASRシステムがさまざまなアクセントをうまく扱えるようになったよ。
― 1 分で読む
この研究は、チュニジアアラビア語のようなリソースが少ない言語における音声技術を評価してるんだ。
― 1 分で読む
マンバはスピーチタスクでトランスフォーマーに対して期待できる成果を見せてて、特に長い入力に対して効果的だね。
― 1 分で読む
コンテキストが自動音声認識の精度と単語認識をどう向上させるかを学ぼう。
― 1 分で読む
研究がポーランド語の音声認識システムを評価する新しい方法を提案している。
― 1 分で読む
プロンプトデザインを改善して書き起こしの精度を高める研究。
― 1 分で読む
新しいモデルは、統合システムを通じて音声翻訳の質を向上させることを目指している。
― 1 分で読む
新しい方法は、自動システムでのささやき声の認識を向上させることを目指している。
― 1 分で読む
AIモデルは音声からテキストへの変換の精度を向上させる。
― 1 分で読む
研究は、より良い精度のために言語モデルを使ってASRシステムを強化する。
― 1 分で読む
新しいシステムは、文脈に合ったキーワードを使って音声認識を向上させて、より正確にするよ。
― 1 分で読む
新しい方法が複数言語のASRモデルを強化し、過去の知識を保持してるよ。
― 1 分で読む
カナダの裁判システムにおける音声認識の検証とその影響。
― 1 分で読む
研究によると、LLMが日本語の自動音声認識を強化することがわかったよ。
― 1 分で読む
SALSAは、音声認識精度を向上させるために、低リソース言語向けにASRと言語モデルを統合しているよ。
― 1 分で読む
聴覚障害者や難聴者向けの自動音声認識の性能を調査中。
― 1 分で読む
新しい方法が音声データを活用して自閉症の評価を改善するんだって。
― 1 分で読む
さまざまな分野での生成モデルの最新の進展を調査中。
― 1 分で読む
新しいモデルは、音声認識とエンティティ認識を組み合わせて、より良い結果を出すよ。
― 1 分で読む
新しいアプローチがASRシステムを強化して、教室でのコミュニケーションを良くする。
― 1 分で読む
この記事では、さまざまな入力が音声認識の精度を向上させる方法について探ります。
― 1 分で読む