Back to list
arxiv_cs_ai 2026年2月10日

ANCHOR: GUI アgent向けの分岐点データ生成

ANCHOR: Branch-Point Data Generation for GUI Agents

Translated: 2026/3/7 8:17:49

Japanese Translation

実際のデスクトップ環境で使用するエンドツーエンドのGUIア gentには大規模な高品質のインタラクションデータが必要ですが、人間のデモンストレーションを収集するのは高価でありまして、既存の合成 pipelinesはタスクの多様性または目的に向かう noisy のトライアルに問題があります。我々は、小セットの確証されたシードデモからの拡大したデスクトップ監視フレームワーク イー nchor を提示します。すべてのseedから始め、意味のある状態変化に対応する分岐点を検出して、現在のGUIコンテキストに基づいた新しいステートガウンディングなタスク変種を提案します。一部実行しているア gentは、提案された指示に従って新しいトライアルを作成し、検証者は状態に関連するチェックを行い、トライアルレベルの一致性に対する作業の実行者からの強制が行われます。質の改善を目的として、さらにタスク条件に従ったステップレベルのフィルターを適用して不適格なアクションを取り除き、分岐後のタッチでコントロール意図の破綻を引き起こさないようにします。標準的なデスクトップベジェンダー ベクと OSWorld、そして WindowsAgentArena 上での実験によると。チューニングしたモデルはゼロショット エントリーや代表的シナリオ生成ベースラインに比べて一貫して改善がありましたし、アプリケーションやOS間の一般化も見られました。

Original Content

arXiv:2602.07153v1 Announce Type: new Abstract: End-to-end GUI agents for real desktop environments require large amounts of high-quality interaction data, yet collecting human demonstrations is expensive and existing synthetic pipelines often suffer from limited task diversity or noisy, goal-drifting trajectories. We present a trajectory expansion framework Anchor that bootstraps scalable desktop supervision from a small set of verified seed demonstrations. Starting from each seed, we identify branch points that correspond to meaningful state changes and propose new, state-grounded task variants conditioned on the current GUI context. An executing agent then follows the proposed instructions to generate new trajectories, while a verifier enforces task completion via state-aware checks and trajectory-level consistency. To improve supervision quality, we further apply task-conditioned step-level filtering to remove ungrounded actions and denoise post-branch segments to maintain coherent intent. Experiments on standard desktop benchmarks, OSWorld and WindowsAgentArena, show that models fine-tuned on our expanded corpus achieve consistent improvements over zero-shot agents and representative synthesis baselines, and generalize across applications and operating systems.