AILIBERALMEDIA
長期タスク対応のLLM決定エージェントとスキルバンクの共進化フレームワーク
← 一覧に戻る
LLM研究ロボティクス

長期タスク対応のLLM決定エージェントとスキルバンクの共進化フレームワーク

速 報2026.04.25 09:31

長期的な相互作用環境でエージェントのスキル活用能力を評価するため、LLM決定エージェントが学習可能なスキルバンクからスキルを取得して行動を導く一方、スキルパイプラインがロールアウトから再利用可能なスキルを発見するCOSPLAYフレームワークが提案された。このアプローチにより、エージェントのスキル検索と行動決定の継続的な向上が期待される。

長期的な相互作用環境は、エージェントのスキル活用能力を評価するためのテストベッドとなっています。このような環境では、複数ステップの推論、多くのタイムステップにわたる複数のスキルの連鎖、遅延報酬と部分的な観測可能性の下での堅牢な意思決定が要求されます。ゲームはエージェントのスキル活用を環境内で評価するための優れたテストベッドです。大規模言語モデル(LLM)はゲームプレイングエージェントとして有望な代替案を提供していますが、複数のエピソード全体にわたって構造化されたスキルを発見、保持、再利用するメカニズムが不足しているため、一貫性のある長期的な意思決定に苦労することが多くあります。

本研究ではCOSPLAYという共進化フレームワークを提案しています。このフレームワークではLLM決定エージェントが学習可能なスキルバンクからスキルを検索して行動を導く一方で、エージェント管理型スキルパイプラインが未ラベル付きロールアウトから再利用可能なスキルを発見してスキルバンクを形成します。このフレームワークは決定エージェントのより優れたスキル検索と行動の学習を促進します。

PR / 広告

すべてのWebサイトに AIアシスタントをつけよう。

  • YouTubeの要約やウェブサイトの分析など、使い方は無限大
  • 最新AIモデルを1つに統合しコストを削減
  • 500万人以上が利用する信頼のブランド
無料で始める
クーポンコードMERLIN20で20%オフ

関連記事

MistralがLe ChatをVibeに改名——メール・コード・レポートをこなす全機能型ワークエージェントへ
LLM生成AIビジネス

MistralがLe ChatをVibeに改名——メール・コード・レポートをこなす全機能型ワークエージェントへ

2026.05.28 13:33
iPhoneユーザーが語る:車内アシスタントはAndroid AutoのGeminiがSiriより断然優れている理由
Google生成AI音声AI

iPhoneユーザーが語る:車内アシスタントはAndroid AutoのGeminiがSiriより断然優れている理由

2026.05.28 13:33
AIコンピュート競争が生んだ次世代チップメーカー——General ComputeとSambaNova連合の挑戦
ビジネスLLMNvidia

AIコンピュート競争が生んだ次世代チップメーカー——General ComputeとSambaNova連合の挑戦

2026.05.28 13:32