Back to list
MISTY: Mixer に基づくワンステップドリフトによる高スループット動計画
MISTY: High-Throughput Motion Planning via Mixer-based Single-step Drifting
Translated: 2026/4/24 20:26:58
Japanese Translation
arXiv:2604.21489v1 Announce Type: cross
要旨:マルチモーダル軌道生成は安全な自律走行に不可欠ですが、既存の拡散モデルに基づくプランナーは反復的なニューラル関数評価により推論遅延が高くなります。本稿では、純粋なワンステップ推論により最優先のクローズドループ性能を実現する、高スループット生成動計画器 MISTY(Mixer-based Inference for Single-step Trajectory-drifting Yield)を提案します。MISTY は、環境文脈を捉えるベクトラーサイズのサブグラフエンコーダ、専門家の軌道を compact な 32 次元の潜在変数流形へ構造化する変分自動エンコーダー(VAE)、そして二次注意力複雑性を排除する超軽量な MLP-Mixャーデコーダーを統合しています。特に、我々は潜在空間のドリフト損失を導入し、複雑な分布進化を完全にトレーニングフェーズへシフトさせました。明示的な引力と反引力の形でこの機構を形式化することで、モデルはアクティブな追い越しなど、生粋の専門家のデモンストレーションから事実上欠如している能動的な演挙を合成する能力を獲得しました。nuPlan ベンチマークの大規模評価では、MISTY は挑戦的な Test14-hard 分割において最優先の結果、非反応的設定と反応的設定で総合スコアをそれぞれ 80.32 と 82.21 で取得しました。推論速度は 99 FPS を超過し、エンドツーエンド遅延は 10.1 ms であるため、反復拡散プランナーに比べ orders of magnitude の速度向上を実現すると同時に、著しい生成の安定性も保証しています。
Original Content
arXiv:2604.21489v1 Announce Type: cross
Abstract: Multi-modal trajectory generation is essential for safe autonomous driving, yet existing diffusion-based planners suffer from high inference latency due to iterative neural function evaluations. This paper presents MISTY (Mixer-based Inference for Single-step Trajectory-drifting Yield), a high-throughput generative motion planner that achieves state-of-the-art closed-loop performance with pure single-step inference. MISTY integrates a vectorized Sub-Graph encoder to capture environment context, a Variational Autoencoder to structure expert trajectories into a compact 32-dimensional latent manifold, and an ultra-lightweight MLP-Mixer decoder to eliminate quadratic attention complexity. Importantly, we introduce a latent-space drifting loss that shifts the complex distribution evolution entirely to the training phase. By formulating explicit attractive and repulsive forces, this mechanism empowers the model to synthesize novel, proactive maneuvers, such as active overtaking, that are virtually absent from the raw expert demonstrations. Extensive evaluations on the nuPlan benchmark demonstrate that MISTY achieves state-of-the-art results on the challenging Test14-hard split, with comprehensive scores of 80.32 and 82.21 in non-reactive and reactive settings, respectively. Operating at over 99 FPS with an end-to-end latency of 10.1 ms, MISTY offers an order-of-magnitude speedup over iterative diffusion planners while while achieving significantly robust generation.