TADPoLe:TADPoLe:言語で学ぶーニングして、タスクをうまく実行させる。自然言語の報酬を使ってエージェントをトレ機械学習強化学習と自然言語指示の出会いTADPoLeは、自然なタスク実行のためにテキストベースの報酬を使ってエージェントを訓練するよ。2025-07-22T00:21:00+00:00 ― 1 分で読む