Rebornは、ラベル付きデータなしで自動音声認識の革新的なソリューションを提供してるよ。
― 1 分で読む
最先端の科学をわかりやすく解説
Rebornは、ラベル付きデータなしで自動音声認識の革新的なソリューションを提供してるよ。
― 1 分で読む
新しいフレームワークが言語モデルを強化して、いろんな話し方に気づいて反応できるようになったんだ。
― 1 分で読む
さまざまなアプリケーションでオーディオコーデックのパフォーマンスを評価する新しいシステム。
― 1 分で読む
音声タスクにおける基盤モデルを評価するための新しいフレームワーク。
― 1 分で読む
フィードバックを通じて言語モデルの継続的な改善を評価する新しいツール。
― 1 分で読む
新しい方法で、騒がしい環境でもスピーチ認識が良くなる適応技術が使われてるんだ。
― 1 分で読む
新しい方法で疑似ステレオデータを使って機械対話が改善される。
― 1 分で読む
DogeRMは、一般的なモデルとドメイン特化型モデルを組み合わせて、言語モデルのパフォーマンスを効果的に向上させるんだ。
― 1 分で読む
新しいフレームワークが限られたデータとリソースでASRのパフォーマンスを向上させる。
― 1 分で読む
音声データの中でコーデックが感情のトーンをどう保持するかを調べてる。
― 1 分で読む
この記事では、ユーザー支援が大規模言語モデルのSQLクエリ生成のパフォーマンスをどう改善できるかを考察します。
― 1 分で読む
この記事は、構造化生成が言語モデルの推論と理解にどのように影響するかを調べている。
― 1 分で読む
新しいデータセットが、性別や年齢に基づくスピーチモデルのバイアスを明らかにしてるよ。
― 1 分で読む
研究によると、スピーチモデルのニューロンが音の重要な特徴をどう認識するかがわかったよ。
― 1 分で読む
この記事では、自己教師あり学習を使った音声モデルの効率的なトレーニング方法について話してるよ。
― 1 分で読む
この研究は、リソースが豊富なデータを使ってあまり一般的じゃない言語の感情認識システムを強化するもので。
― 1 分で読む
この研究は、LLMが映画の要約で物語のトロープをどれくらい理解しているかを評価しているよ。
― 1 分で読む
Codec-SUPERBチャレンジの結果とコーデックのパフォーマンス指標を見てみよう。
― 1 分で読む
新しいスピーチ言語モデルの方法は、大量のデータの必要性を減らす。
― 1 分で読む
Align-SLMがコンピュータ音声生成をどう変えてるか探ってみて。
― 1 分で読む
台湾の普通話で自然な会話ができるAIモデルを作ってる。
― 1 分で読む
新しい言語を効果的に学ぶための実用的なヒントガイド。
― 1 分で読む
新しい方法が機械の話し言葉の認識を改善してる。
― 1 分で読む
新しい方法が、これまで遭遇したことのない言語のASRシステムを改善してるよ。
― 1 分で読む
新しい方法がモデルを統合して、安全性とパフォーマンスを向上させる。
― 1 分で読む