音声における音韻変化に対する機械の適応に関する研究。
― 1 分で読む
最先端の科学をわかりやすく解説
音声における音韻変化に対する機械の適応に関する研究。
― 1 分で読む
システムは音声と映像を組み合わせて、スピーカー検出の精度を高めてる。
― 1 分で読む
新しい方法で疑似ステレオデータを使って機械対話が改善される。
― 1 分で読む
この研究では、ピンインを使って中国語のASR精度を向上させるためのデータセットと方法を紹介してるよ。
― 1 分で読む
この研究は、高度な手法を使ってディープフェイク音声の検出を改善することに焦点を当ててるよ。
― 1 分で読む
不確実性を理解することで、現実のシナリオでの感情認識の精度が向上するよ。
― 1 分で読む
広範なデータなしで多言語オーディオのスピーカー認識システム。
― 1 分で読む
プライバシーを確保するために、9言語の話者匿名化技術を改善中。
― 1 分で読む
研究は、騒がしい環境でのスピーチ認識を改善するためのビデオの役割を強調している。
― 1 分で読む
新しい方法で、複数の話者からの音声認識の精度が向上した。
― 1 分で読む
聴覚皮質が時間にわたって音をどう統合するかを探ってみて。
― 1 分で読む
新しい方法で、デュアルニューラルネットワークを使って騒がしい環境でもスピーチの明瞭さが向上する。
― 0 分で読む
XLSR-トランスデューサーモデルは、最小限のデータでリアルタイムの文字起こしに優れてるよ。
― 1 分で読む
新しいモデルが、複数の言語での音声認識精度を向上させたんだ。
― 1 分で読む
研究によると、Whisperのようなマルチタスク音声モデルにはリスクがあるらしい。
― 1 分で読む
TokenVerseは、複数のタスクを1つのモデルに統合することで、話し言葉の会話の分析を簡単にしてくれるんだ。
― 1 分で読む
この研究では、雑音のあるスピーチ条件でのキーワードスポッティングのためのMix-Trainingを調べてるよ。
― 1 分で読む
オンラインデータが少ない言語の音声認識システムを改善する。
― 1 分で読む
この研究は、ニューラルネットワークがスペクトログラムを使って音声をどう解釈するかを調べてるよ。
― 1 分で読む
コンテキストが自動音声認識の精度と単語認識をどう向上させるかを学ぼう。
― 1 分で読む
この研究は、アッサム語の母音調和パターンを探るためにfiwGANを使っているよ。
― 1 分で読む
新しいフレームワークが限られたデータとリソースでASRのパフォーマンスを向上させる。
― 1 分で読む
この記事では、自動転写における数値表現のフォーマットを向上させる方法について話してるよ。
― 1 分で読む
研究者たちは、話し言葉をよりよく理解するためのテキストなしのアプローチを探求している。
― 1 分で読む
新しいモデルは雑音やエコーを抑えて話しの明瞭さを向上させるよ。
― 1 分で読む
新しいデータセットが、医療画像のための音声ベースの質問システムで医療を強化する。
― 1 分で読む
プロンプトデザインを改善して書き起こしの精度を高める研究。
― 1 分で読む
新しいアプローチがノイズ環境の説明を使ってSERシステムを強化するよ。
― 1 分で読む
TTSとリアルデータを組み合わせると、音声認識システムが効果的に向上するよ。
― 1 分で読む
新しい方法で、静かなスピーチを理解できる音声に変換するのが改善されたよ。
― 1 分で読む
新しい方法が、複数の話者がいる騒がしい環境での音声分離を改善する。
― 1 分で読む
この研究では、音声信号の意義を評価する方法を提案しているよ。
― 0 分で読む
新しい方法は、自動システムでのささやき声の認識を向上させることを目指している。
― 1 分で読む
AIモデルは音声からテキストへの変換の精度を向上させる。
― 1 分で読む
録音された会話を分析しながらプライバシーを守る技術を調べる。
― 1 分で読む
新しいモデルが音声と視覚データを統合して、音声認識と翻訳を行うんだ。
― 1 分で読む
新しい方法がさまざまなアクセントの音声認識精度を向上させる。
― 1 分で読む
Wav2graphは、話された言語からナレッジグラフを作って、AIの理解を向上させるんだ。
― 1 分で読む
MulliVCは、言語間で声を驚くほど精度高くクリアに変換するよ。
― 1 分で読む
新しいロボットナビゲーションシステムは、感情を通じて話しかけられた指示を理解するんだ。
― 1 分で読む