Zhenmei Shi

機械学習大規模言語モデルと数学的推論

LLMの数学の問題を解く能力、特に剰余算について調べてる。

2025-09-01T14:38:32+00:00 ― 1 分で読む

機械学習ニューラルネットワークにおけるソフトマックスの役割

ニューラルネットワークの性能と応用におけるソフトマックスの重要性を探る。

2025-08-13T07:02:54+00:00 ― 1 分で読む

機械学習トランスフォーマーの注意効率を改善する

新しい方法が言語モデルの注意メカニズムを強化して、パフォーマンスを向上させるよ。

2025-08-12T17:05:30+00:00 ― 1 分で読む

機械学習機械学習における拡散モデルの理解

拡散モデルの基本とさまざまな分野での応用を探る。

2025-08-07T06:52:24+00:00 ― 0 分で読む

機械学習テンソルアテンションメカニズムの進展

テンソルアテンションを探って、AIモデルのデータ処理への影響について。

2025-08-07T06:44:30+00:00 ― 1 分で読む

機械学習大きなモデルにおけるインコンテキスト学習の課題

大きなモデルが小さいモデルに比べてインコンテキスト学習で苦戦する理由を調べる。

2025-08-05T08:55:18+00:00 ― 1 分で読む

機械学習プレフィックス学習とNTKアテンションで言語モデルを強化する

革新的な手法を使った言語モデルのファインチューニングの進展。

2025-07-26T01:47:00+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 AIの空間的推論能力の課題

現在のモデルは空間的推論が苦手で、画像よりもテキストに頼っているんだ。

2025-07-26T01:07:30+00:00 ― 1 分で読む

機械学習 AIシステムにおけるプライバシーとパフォーマンスのバランス

AIにおけるユーザーデータ保護のための差分プライバシーとNTK回帰の検討。

2025-07-11T01:56:18+00:00 ― 1 分で読む

機械学習 AIのクロスアテンションメカニズムにおけるプライバシーの保護

AIアプリケーションでセンシティブな情報を守るための差分プライバシーの探求。

2025-07-10T14:21:06+00:00 ― 1 分で読む

計算と言語大規模言語モデルの構成能力の評価

複合タスクを簡単なタスクと組み合わせて、LLMがどんなパフォーマンスをするかを探る。

2025-07-09T00:25:54+00:00 ― 1 分で読む

データ構造とアルゴリズム差分プライバシーとジョン楕円体計算の組み合わせ

新しい方法がジョンエリプソイド計算を強化しながら、センシティブなデータを守るんだ。

2025-06-29T13:26:18+00:00 ― 0 分で読む

データ構造とアルゴリズム大規模言語モデルの効率を高める

SparseGPTは、パラメータのプルーニングによって大規模言語モデルの速度と効率を向上させるよ。

2025-06-23T13:23:42+00:00 ― 1 分で読む

機械学習革新的な方法でトランスフォーマーの勾配計算時間を短縮

新しいアプローチが勾配計算を強化して、機械学習のトランスフォーマー効率を向上させる。

2025-06-23T07:28:12+00:00 ― 1 分で読む

計算と言語言語モデルの長い入力処理を改善する

長いテキスト入力の効率を高める言語モデルの方法。

2025-06-06T05:27:36+00:00 ― 1 分で読む

機械学習言語処理におけるトランスフォーマー: 限界と可能性

Transformer技術が言語理解における能力と課題を探る。

2025-05-24T19:18:45+00:00 ― 1 分で読む

計算複雑性現代ホップフィールドネットワークの秘密を暴く

MHNが機械学習をどうやって強化できるかをもっと詳しく見てみよう。

2025-04-03T15:17:33+00:00 ― 1 分で読む

計算複雑性マンバ対状態空間モデル：AI対決

AIの能力におけるMambaと状態空間モデルの考察。

2025-04-02T21:38:15+00:00 ― 1 分で読む

機械学習 AIの未来：テンソルアテンションの説明

テンソルアテンションがAIの言語処理をどう変えるかを知ってみよう。

2025-02-01T10:43:03+00:00 ― 1 分で読む

機械学習ファストトラッキングAI: RoPEアテンションメカニズム

新しい方法がRoPEアテンションを改善して、AIの計算を大幅に速くしてるよ。

2025-01-29T08:53:15+00:00 ― 1 分で読む