ASR に関する最新の記事

暗号とセキュリティ大規模MLモデル向けの新しいバックドア攻撃手法

先進的な機械学習モデルに対するバックドア攻撃の資源効率の良いアプローチ。

2025-08-07T00:01:36+00:00 ― 1 分で読む

計算と言語音声認識のためのフェデレーテッドラーニングの進展

ASRシステムで効率的なフェデレーテッドラーニングのための早期終了モデルの活用。

2025-08-06T09:48:24+00:00 ― 1 分で読む

機械学習雑音除去言語モデルを使った音声認識の進展

ノイズ除去言語モデルは、合成データを使って音声認識システムのエラー修正を改善するよ。

2025-08-03T22:34:10+00:00 ― 1 分で読む

音声・音声処理 VPIDMを使った音声強化の進展

新モデルVPIDMは騒がしい環境での音声の明瞭さを向上させる。

2025-08-03T16:54:05+00:00 ― 1 分で読む

ロボット工学デスクトップロボットの進展

自然言語と視覚認識技術を使ったデスクトップロボットに関する研究。

2025-08-03T13:39:45+00:00 ― 1 分で読む

計算と言語攻撃に対する言語モデルの安定性を向上させる

新しい方法が、異なる入力条件下での言語モデルの予測を改善してるよ。

2025-08-03T07:56:30+00:00 ― 1 分で読む

音声・音声処理音声認識における4Dモデルの紹介

新しいモデルは、複数のデコード方法を使って音声認識を向上させてる。

2025-08-01T01:44:35+00:00 ― 1 分で読む

人工知能多言語モデルを評価する新しいアプローチ

言語モデルの安全性と多言語スキルをテストする新しい方法。

2025-07-28T02:37:54+00:00 ― 1 分で読む

人工知能言語モデルにおけるバックドア攻撃の軽減

バックドア攻撃に対するLLMの新しい防御戦略。

2025-07-26T23:22:36+00:00 ― 1 分で読む

計算と言語 ASRシステムにおけるスピーチエラー訂正の改善

新しい方法は、音響特徴と信頼スコアを組み合わせて、エラー修正をより良くするよ。

2025-07-25T20:45:15+00:00 ― 1 分で読む

計算と言語拼音正则化による中国語音声認識の改善

この研究では、ピンインを使って中国語のASR精度を向上させるためのデータセットと方法を紹介してるよ。

2025-07-25T07:47:55+00:00 ― 1 分で読む

計算と言語チュニジアアラビア語の音声技術の進展

この研究は、チュニジアアラビア語のようなリソースが少ない言語における音声技術を評価してるんだ。

2025-07-21T12:18:00+00:00 ― 1 分で読む

音声・音声処理エミリアの紹介：新しいスピーチ生成データセット

エミリアはスピーチ生成モデルを改善するための多様なデータセットを提供してるよ。

2025-07-20T09:34:45+00:00 ― 1 分で読む

音声・音声処理 ASRトランスクリプトの数値フォーマットを改善する

この記事では、自動転写における数値表現のフォーマットを向上させる方法について話してるよ。

2025-07-14T15:55:35+00:00 ― 1 分で読む

計算と言語音声翻訳技術の進歩

新しいモデルは、統合システムを通じて音声翻訳の質を向上させることを目指している。

2025-07-11T02:54:20+00:00 ― 1 分で読む

音声・音声処理 AIとのコラボで音声認識を向上させる

AIモデルは音声からテキストへの変換の精度を向上させる。

2025-07-07T09:50:10+00:00 ― 1 分で読む

計算と言語専門用語の音声認識を改善する

研究は、より良い精度のために言語モデルを使ってASRシステムを強化する。

2025-07-06T20:41:12+00:00 ― 1 分で読む

計算と言語文脈ノイズ表現学習を使った音声認識の向上

騒がしい環境での音声認識の質を向上させる方法。

2025-07-01T23:28:15+00:00 ― 1 分で読む

マルチメディア Eコマース商品検索の進展

新しい方法で、さまざまなメディアフォーマットでの製品検索が改善されるよ。

2025-07-01T08:45:24+00:00 ― 1 分で読む

人工知能 SAGE-RT: 言語モデルの安全性のための新しい手法

SAGE-RTは、言語モデルの安全性評価を改善するために合成データを作成します。

2025-06-28T06:37:42+00:00 ― 1 分で読む

サウンド技術を使った音声品質評価の進歩

新しい方法が声の質評価を改善して、声帯の問題を持つ患者をサポートするよ。

2025-06-26T07:26:15+00:00 ― 1 分で読む

計算と言語自動音声認識の精度評価

音声認識システムの精度を測る新しい方法についての考察。

2025-06-22T20:50:45+00:00 ― 1 分で読む

計算と言語言語モデルを使って自動音声認識を改善する

新しい方法で、言語モデルを使ってASRの精度がアップして、より良い文字起こしができるようになったよ。

2025-06-21T20:33:15+00:00 ― 1 分で読む

サウンドマルチスピーカー音声認識の進展

新しい方法が、複数の話者がいる難しい状況での音声認識を改善するんだ。

2025-06-20T21:52:55+00:00 ― 1 分で読む

計算と言語自閉症診断のためのスピーチデータの活用

新しい方法が音声データを活用して自閉症の評価を改善するんだって。

2025-06-19T19:12:12+00:00 ― 1 分で読む

音声・音声処理モジュラリティで自動音声認識を強化する

モジュラーASRシステムの研究は、騒がしい環境でのパフォーマンスを向上させることを目指してるよ。

2025-06-16T17:28:35+00:00 ― 1 分で読む

音声・音声処理 Sortformerを使った音声認識の進展

Sortformerはスピーカーダイアライゼーションと音声認識（ASR）を統合して、音声処理を改善してるんだ。

2025-06-15T09:05:15+00:00 ― 1 分で読む

音声・音声処理複数話者の設定での音声認識を改善する

新しいアプローチは、特定の話者の詳細に焦点を当てることでASRを強化する。

2025-06-11T17:38:15+00:00 ― 1 分で読む

サウンド ESPnet-EZ: スピーチモデル開発を簡単にする

複雑なコードなしでスピーチモデルを微調整するのに使いやすいツール。

2025-06-11T15:12:30+00:00 ― 1 分で読む

ロボット工学ロボットの音声認識を改善してより良いコラボレーションを実現する

新しいモデルがロボットがあいまいな人間の指示にもっと効果的に従えるように助けてるよ。

2025-06-11T14:53:18+00:00 ― 1 分で読む

サウンド CADA-GANで自動音声認識を進化させる

CADA-GANは、いろんな録音環境でASRシステムの性能を向上させるよ。

2025-06-07T23:45:30+00:00 ― 1 分で読む

計算と言語暗黙のテクニックで音声認識を進化させる

新しい方法が、認識と応答プロセスを統合することでスピーチインタラクションを改善する。

2025-06-06T03:21:12+00:00 ― 1 分で読む

音声・音声処理ニューラルオーディオコーデックの評価：Codec-SUPERBチャレンジからの洞察

Codec-SUPERBチャレンジの結果とコーデックのパフォーマンス指標を見てみよう。

2025-06-05T06:58:50+00:00 ― 1 分で読む

計算と言語マラサール語の音声認識を革新する

プロジェクトは、タミルのリソースを使ってマラサール語の音声認識を改善するよ。

2025-05-23T02:48:37+00:00 ― 1 分で読む

サウンドマンバ：音声認識技術の進化

Mambaはスピードと精度で音声認識を強化して、デバイスとのやり取りを変えてるんだ。

2025-05-19T22:39:54+00:00 ― 1 分で読む

計算と言語バングラの方言をつなぐ：統一アプローチ

このプロジェクトは、明確なコミュニケーションのためにバングラの方言を標準化することを目指してるんだ。

2025-05-12T19:19:18+00:00 ― 1 分で読む

音声・音声処理ユナイテッド・メダスR：医療音声認識の改善

新しいASRシステムが医療の音声認識を向上させて、正確な患者ケアを実現するよ。

2025-04-30T00:58:50+00:00 ― 1 分で読む

計算と言語話者属性付き音声認識の新しい方法

自動音声認識を使って、多言語環境でスピーカーを効率よく追跡する。

2025-04-20T15:33:18+00:00 ― 1 分で読む

計算と言語ピンインで音声認識を強化する

新しいモデルが中国語の音声認識精度を大幅に向上させたよ。

2025-04-15T08:10:03+00:00 ― 1 分で読む

計算と言語ネオ・アラマイックを守る：危機に瀕する言語

絶滅危惧の新アラム語を記録して保存するための取り組み。

2025-04-13T14:26:15+00:00 ― 1 分で読む