計画におけるLLM:新しい計画におけるLLM:新しいアプローチ上させる。批評家とLLMを統合して、計画の効果を向人工知能LLMとプランニングのバランス:LLM-Moduloフレームワーク外部ガイダンスを使ってLLMを計画タスクに統合するための構造的アプローチ。2025-09-11T23:53:30+00:00 ― 1 分で読む
AIにおけるReActの再AIにおけるReActの再考響を調べる。ReActがLLMの能力に与える実際の影人工知能ReActを再評価する: プロンプトエンジニアリングを深掘りするこの研究は、ReActがLLMのパフォーマンス向上にどれだけ効果があるかを疑問視してる。2025-08-09T03:06:48+00:00 ― 1 分で読む
強化学習におけるLLM強化学習におけるLLMを向上させる。LLM生成の報酬シェイピングでRLの効率機械学習強化学習における報酬シェーピングのための大規模言語モデルの活用この作品は、報酬シェイピングを使って強化学習を改善するためのLLMの役割について探る。2025-08-08T16:19:00+00:00 ― 1 分で読む