Back to list
Umwelt の構築:信念と意図の協調進化を通じた認知計画
Constructing the Umwelt: Cognitive Planning through Belief-Intent Co-Evolution
Translated: 2026/3/15 16:04:39
Japanese Translation
arXiv:2511.05540v3 Announce Type: replace
Abstract: 本論文は、エンドツーエンド自律運転において支配的となっている認識論的仮定に挑戦します。その仮定は、高パフォーマンスな計画には高忠実度の世界再構築が必須であるというものです。認知科学に着想を得て、当論文ではメンタルベイジアン因果世界モデル(Mental Bayesian Causal World Model、MBCWM)を提案し、それをトークナイズド・インテント・ワールドモデル(Tokenized Intent World Model、TIWM)という革新的な認知計算アーキテクチャとして具体化します。その核心哲学は、知性がピクセルレベルの客観忠実度から生まれ出すのではなく、エージェント内部の意図的世界と物理的现实間の『Cognitive Consistency(認知的整合性)』から生じると主張します。von Uexküll の Uwelt 理論、神経アセンブリ仮説、および三要素因果モデル(記号推論、確率帰納、力学的ダイナミクスを統合)を組み合わせてエンドツーエンドの具体化計画システムを構築した上で、当 paradigm の nuPlan ベンチマーク上での実現可能性を証明します。オープンループ検証の実験結果は、当社の信念と意図の協調進化機構が計画パフォーマンスを効果的に向上させると確認しました。特に、クローズドループシミュレーションにおいて、このシステムは地図の適応理解、自由探索、自己回復戦略を含む、類人的な認知的行動を出現させました。当論文は『Cognitive Consistency』を核心的な学習機構として特定し、長期的なトレーニング過程において、信念(状態理解)と意図(将来予測)は明示的な計算による再プレイを通じて自己組織化する均衡に到達し、内部表現と物理的世界の適応間にセマンティックな一致をもたらします。TIWM は再構築型プランナーに対する神経記号・認知優先の代替案を提供し、新しい方向性「能動的な理解としての計画」、すなわち受動的な反応としての計画へと転換しました。
Original Content
arXiv:2511.05540v3 Announce Type: replace
Abstract: This paper challenges a prevailing epistemological assumption in End-to-End Autonomous Driving: that high-performance planning necessitates high-fidelity world reconstruction. Inspired by cognitive science, we propose the Mental Bayesian Causal World Model (MBCWM) and instantiate it as the Tokenized Intent World Model (TIWM), a novel cognitive computing architecture. Its core philosophy posits that intelligence emerges not from pixel-level objective fidelity, but from the Cognitive Consistency between the agent's internal intentional world and physical reality. By synthesizing von Uexk\"ull's $\textit{Umwelt}$ theory, the neural assembly hypothesis, and the triple causal model (integrating symbolic deduction, probabilistic induction, and force dynamics) into an end-to-end embodied planning system, we demonstrate the feasibility of this paradigm on the nuPlan benchmark. Experimental results in open-loop validation confirm that our Belief-Intent Co-Evolution mechanism effectively enhances planning performance. Crucially, in closed-loop simulations, the system exhibits emergent human-like cognitive behaviors, including map affordance understanding, free exploration, and self-recovery strategies. We identify Cognitive Consistency as the core learning mechanism: during long-term training, belief (state understanding) and intent (future prediction) spontaneously form a self-organizing equilibrium through implicit computational replay, achieving semantic alignment between internal representations and physical world affordances. TIWM offers a neuro-symbolic, cognition-first alternative to reconstruction-based planners, establishing a new direction: planning as active understanding, not passive reaction.