Bhiksha Raj

コンピュータビジョンとパターン認識網膜ぼやけでDNNのロバストネスを向上させる

研究によると、人間の視覚を真似ることで、ディープニューラルネットワークが攻撃に対して強化されることがわかった。

2025-10-13T14:57:00+00:00 ― 1 分で読む

機械学習生物学的知見で深層ニューラルネットワークを改善する

新しいレイヤーがDNNの微妙な入力変化への耐性を強化する。

2025-10-11T15:09:18+00:00 ― 1 分で読む

計算と言語 BASSを使ったスピーチ要約の進展

BASSは長い音声の要約をブロック処理することで改善する。

2025-10-08T15:05:55+00:00 ― 1 分で読む

機械学習モデル訓練におけるラベルエラーの対処

この記事では、トレーニングデータのノイズの多いラベルに関する課題と解決策を検討してるよ。

2025-09-20T07:53:36+00:00 ― 1 分で読む

音声・音声処理テキストのみのトレーニングによる音声キャプションの進展

新しい方法が音声キャプションシステムをテキストの説明だけでトレーニングするんだ。

2025-09-13T02:56:55+00:00 ― 1 分で読む

機械学習弱い教師あり学習技術の進展

新しいフレームワークが不完全なデータラベルからの学習を改善する。

2025-09-12T00:01:24+00:00 ― 1 分で読む

ロボット工学予測できないチャレンジのためのロボットテスト

予測できない環境でロボットのパフォーマンスを向上させる方法を探ってる。

2025-09-09T02:53:54+00:00 ― 1 分で読む

機械学習ネガティブ例の選択を通じて弱ラベル学習を改善する

新しい戦略は、関連するネガティブ例を選ぶことによって弱ラベル学習を強化する。

2025-09-06T04:57:20+00:00 ― 1 分で読む

機械学習騒がしいモデル学習の課題

事前学習データのノイズがモデルのパフォーマンスにどう影響するかを調べる。

2025-08-30T14:35:18+00:00 ― 1 分で読む

音声・音声処理 PAMを使った音質評価の新しいアプローチ

PAMは、参照録音なしで音質を測定する新しい方法を提供してるよ。

2025-08-26T21:10:50+00:00 ― 1 分で読む

音声・音声処理騒がしい環境での音声認識の評価

新しいベンチマークが、さまざまな妨害の中で音声認識システムの性能を評価する。

2025-08-19T14:16:50+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識拡散モデルにおけるわずかな腐敗の利点

トレーニングデータの小さなエラーがAI生成コンテンツをどう向上させるかを調査中。

2025-08-04T09:29:06+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識ノイズのある環境でのSLAMモデルの評価

新しいフレームワークが厳しい条件下でのSLAMの性能を評価する。

2025-07-25T00:06:30+00:00 ― 1 分で読む

計算と言語資源が少ない言語の音声認識における革新的な技術

新しい方法が、データが少ない言語のスピーチモデルを改善してるよ。

2025-07-24T19:39:10+00:00 ― 0 分で読む

サウンド音声感情認識技術の進展

新しい方法で、機械が人間の感情を話し声からもっと理解できるようになったよ。

2025-07-12T18:34:55+00:00 ― 1 分で読む

サウンドオーディオ言語モデルの推論評価

この研究は、新しいタスクを使って音声言語モデルの推論スキルを評価してるよ。

2025-07-10T09:54:05+00:00 ― 1 分で読む

計算と言語スピーチ要約に対する注釈方法の影響

この研究は、いろんな要約方法が質と内容にどう影響するかを調べてるよ。

2025-07-02T05:56:55+00:00 ― 1 分で読む

サウンド音声認識を音素特徴で向上させる

新しいフレームワークが声のアイデンティティ確認の精度を向上させる。

2025-06-15T01:50:18+00:00 ― 1 分で読む

サウンド人間にインスパイアされた特徴で音声認識を改善する

新しい音響特徴が騒がしい環境でのASRシステムのパフォーマンスを向上させる。

2025-06-03T14:29:40+00:00 ― 1 分で読む

音声・音声処理 ESPnet-Codecによるニューラルコーデックの進展

ESPnet-Codecは、音声やオーディオのニューラルコーデックのトレーニングと評価を強化するよ。

2025-06-03T03:09:30+00:00 ― 1 分で読む

サウンド MACEでオーディオキャプションを革命的に変える

MACEは音を正確なテキスト説明にリンクさせることで音声キャプショニングを改善する。

2025-05-28T17:47:08+00:00 ― 1 分で読む

機械学習グラフを理解しよう: ノードから知識へ

POGATが複雑なグラフ構造の分析をどうやって向上させるかを探ってみて。

2025-05-04T12:20:00+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 SoftVQ-VAE: 画像生成の変革

SoftVQ-VAEがどんなふうに画像生成の効率とクオリティをアップさせるかを見てみよう。

2025-03-08T21:22:03+00:00 ― 1 分で読む