Hongning Wang

検索エンジンの結果における健康スニペットの正確性を調べる。

2025-09-13T21:50:36+00:00 ― 1 分で読む

この記事では、異なる目的を持つクライアントのためのフェデレーティッドバンディット学習の方法を紹介するよ。

2025-09-03T00:29:06+00:00 ― 0 分で読む

不確実性推定を使って言語モデルの過剰最適化に報酬を与える新しいアプローチ。

2025-08-31T04:16:54+00:00 ― 1 分で読む

ChatGLM-RLHFは、人間のフィードバックと高度なトレーニング手法を使ってAIのインタラクションを改善するよ。

2025-08-23T14:27:00+00:00 ― 1 分で読む

GLM-4モデルは言語理解と生成の能力が向上してるよ。

2025-07-27T06:52:54+00:00 ― 1 分で読む

LLMがルールをどれだけ理解して適用できるかを評価する新しい方法。

2025-06-20T19:41:36+00:00 ― 1 分で読む

人間のフィードバックがAI言語モデルの応答にどう影響するか学ぼう。

2025-04-02T03:58:57+00:00 ― 1 分で読む

言語モデルの指示に従う能力を高める新しいアプローチ。

2025-02-28T18:21:36+00:00 ― 1 分で読む