音声認識に関する最新の記事

音声・音声処理モジュラードメイン適応：音声認識への新しいアプローチ

MDAは特定のデータ領域にモデルを最適化することで、音声認識を強化するんだ。

2025-11-05T01:24:10+00:00 ― 1 分で読む

音声・音声処理すべての話者のための音声認識を改善する

新しい手法が、構音障害を持つスピーカーのためのASRシステムを強化することを目指してるよ。

2025-11-04T22:58:25+00:00 ― 1 分で読む

計算と言語 MAMLConを使った話す言葉の学習の進展

新しい方法が、少ない例でコンピュータが話された指示を理解するのを改善する。

2025-11-04T22:09:50+00:00 ― 1 分で読む

計算と言語言葉分析を使ってスピーカーダイアライゼーションを改善する

音声での音と話された言葉を組み合わせて、話者の識別を強化する。

2025-11-04T18:55:30+00:00 ― 1 分で読む

音声・音声処理アクティブスピーカー検出技術の進展

新しいフレームワークが音声と映像の手がかりを使ってアクティブスピーカーの検出を改善する。

2025-11-04T16:29:45+00:00 ― 1 分で読む

音声・音声処理スピーチタスクのための一般音響モデルの改善

新しい方法が一般的な音声モデルを強化して、効果的な音声認識を実現する。

2025-11-04T05:58:10+00:00 ― 1 分で読む

音声・音声処理継続学習で話し言葉理解を進化させる

この研究は、音声言語理解における継続的学習を通じてAIの忘却を扱ってるよ。

2025-11-04T00:18:05+00:00 ― 1 分で読む

サウンド CALLSで共感的な音声アシスタントを開発する

CALLSは、音声アシスタントが顧客とのやり取りをうまく処理できるようにすることを目指してる。

2025-11-03T19:26:35+00:00 ― 1 分で読む

音声・音声処理弱教師あり学習で音声認識を進化させる

新しい方法はスピーカーのアイデンティティを活用して音声認識のパフォーマンスを向上させる。

2025-11-03T01:37:45+00:00 ― 1 分で読む

計算と言語チェコの知識を活用してスロバキアの音声認識を進化させる

チェコのモデルからの転移学習を使うと、スロバキアの音声認識精度がアップするよ。

2025-11-02T21:19:36+00:00 ― 1 分で読む

音声・音声処理トルコ語系言語のテキスト音声変換の進展

カザフのデータを使ってあまり知られていないトルコ語系の言語のTTSシステムを作ってるんだ。

2025-11-02T18:20:30+00:00 ― 1 分で読む

サウンド S4Mを使った音声分離の進展

新しいモデルは、騒がしい環境での声の隔離を改善する。

2025-11-02T10:14:40+00:00 ― 1 分で読む

計算と言語 OpenSRを使ったリップリーディング技術の進展

OpenSRは、音声データを使ってリップリーディングモデルを強化し、精度とアクセシビリティを向上させるよ。

2025-11-01T17:48:30+00:00 ― 1 分で読む

計算と言語不流暢さ修正でスピーチ認識を向上させる

研究によると、音声認識システムでの口ごもり修正を強化するモデルが明らかになった。

2025-11-01T17:32:42+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクション教えられるエージェントを使った学習におけるスピーチミス認識の影響

教えられるエージェントを使った学習におけるスピーチエラーの影響に関する研究。

2025-11-01T15:42:06+00:00 ― 0 分で読む

サウンド音声認識の課題に対処するための異和音の言葉

新しい方法で、似たような音の名前の音声認識が向上した。

2025-11-01T14:48:40+00:00 ― 1 分で読む

機械学習マルチタスク自己教師あり学習の進展

新しい方法が音声タスクでモデルの柔軟性とパフォーマンスを向上させる。

2025-11-01T08:20:00+00:00 ― 1 分で読む

計算と言語離散単位を使った話し言葉理解の進展

新しい方法が、書き起こしなしで話し言葉の理解を向上させる。

2025-11-01T00:14:10+00:00 ― 1 分で読む

計算と言語少数派言語の翻訳の進展

タマシェクやケチュアのような資源の少ない言語の翻訳技術を向上させること。

2025-10-31T16:39:36+00:00 ― 1 分で読む

計算と言語音声学習モデルの新しいベンチマーク

BabySLMは、機械が子供の言葉を基にして音声を理解する能力を評価するんだ。

2025-10-31T11:33:20+00:00 ― 1 分で読む

サウンドサイレントスピーチインターフェースの進展

新しい技術でサイレントスピーチ認識システムを改善する。

2025-10-31T07:13:55+00:00 ― 1 分で読む

サウンド弱い監視下でのキーワードスポッティングの進展

雑音の多い環境で弱い監視を使ってキーワードスポッティングモデルをトレーニングする新しい方法。

2025-10-31T01:33:50+00:00 ― 1 分で読む

サウンド強化学習でRNN-Tモデルを改善する

新しいアプローチが自動音声認識におけるRNN-Tのパフォーマンスを向上させる。

2025-10-30T19:53:45+00:00 ― 1 分で読む

計算と言語多言語音声認識システムの進歩

インドの言語での多言語スピーチ認識を向上させる方法を探ってる。

2025-10-30T10:10:45+00:00 ― 1 分で読む

サウンド SVVADを使った音声活動検出の進化

SVVADが音声活動検出を改善して、より良いスピーカーバリフィケーションを実現する方法を見つけよう。

2025-10-30T09:22:10+00:00 ― 1 分で読む

サウンド自動発音評価の進展

新しい方法が語学学習者の発音フィードバックを改善する。

2025-10-30T08:33:35+00:00 ― 1 分で読む

計算と言語音声認識モデルの適応性を測る

新しいフレームワークが、スピーチモデルが特定のタスクにどれだけ適応できるかを評価する。

2025-10-30T06:56:25+00:00 ― 1 分で読む

計算と言語多言語音声翻訳の進展

研究は意味知識を使って多言語音声翻訳を改善する。

2025-10-30T06:07:50+00:00 ― 1 分で読む

ハードウェアアーキテクチャー Sparqを紹介するよ：量子化ニューラルネットワーク向けの新しい処理ソリューション。

Sparqは、リソースの必要が少ない量子化ニューラルネットワークの性能を向上させることを目指してるよ。

2025-10-30T00:45:54+00:00 ― 1 分で読む

サウンド音声認識の遅延：SlothSpeechを詳しく見てみよう

スロースピーチは音声認識システムの脆弱性を暴露して、かなり遅くするんだ。

2025-10-29T17:10:30+00:00 ― 1 分で読む

サウンド EmoMix：感情的な音声合成の進化

EmoMixは、正確な強さで混ざった感情を表現するスピーチの作成を可能にするよ。

2025-10-29T13:56:10+00:00 ― 1 分で読む

計算と言語 HK-LegiCoST：広東語の話し言葉と書き言葉をつなぐ

広東語音声を英語テキストに翻訳するための新しいコーパス。

2025-10-29T11:59:36+00:00 ― 1 分で読む

サウンド MW-MAE: 音声学習への新しいアプローチ

革新的なマルチウィンドウマスク付きオートエンコーダ法で音声処理を強化しよう。

2025-10-29T11:30:25+00:00 ― 1 分で読む

音声・音声処理逐次レベルの一般化エントロピー最小化でASR技術を改善する

新しい方法で自動音声認識システムの精度と適応性が向上するんだ。

2025-10-29T02:36:00+00:00 ― 1 分で読む

計算と言語文脈バイアスを使って音声認識を向上させる

コンテキストバイアスはASRシステムを強化して、専門的なタスクでの精度を向上させるんだよ。

2025-10-29T00:58:50+00:00 ― 1 分で読む

サウンド言語発音検出を改善する新しい方法

この研究では、言語学習者の発音ミスを検出する新しいシステムを紹介してるよ。

2025-10-28T21:44:30+00:00 ― 1 分で読む

計算と言語 DistilXLSRで多言語音声認識を進化させる

新しいモデルはサイズを小さくしながら、多言語の音声認識を向上させる。

2025-10-28T11:12:55+00:00 ― 1 分で読む

計算と言語複数話者の音声認識の進展

新しいシステムが複数の話者がいる環境での音声認識を向上させる。

2025-10-28T00:41:20+00:00 ― 1 分で読む

音声・音声処理音声処理とビジュアル学習の融合

この研究は、音声処理と視覚データを統合することの利点を調べているよ。

2025-10-27T20:38:25+00:00 ― 1 分で読む

計算と言語アラビア語方言におけるWhisperのパフォーマンス評価

Whisperがいろんなアラビア語の方言やアクセントをどう扱ってるか見てみよう。

2025-10-27T13:21:10+00:00 ― 1 分で読む

音声認識 に関する最新の記事

音声認識に関する最新の記事