Back to list
SemaPop: 意味条件付きかつ制御可能な人口合成
SemaPop: Semantic-Persona Conditioned and Controllable Population Synthesis
Translated: 2026/4/24 20:30:32
Japanese Translation
arXiv:2602.11569v2 Announce Type: replace
Abstract: 人口合成は交通計画や社会経済分析における個体レベルのシミュレーションに不可欠であるが、統計的依存関係と高次元の行動的意味の両方を捉える必要性により依然として困難である。既存のデータ駆動アプローチは主に無条件生成に依存しており、シナリオ駆動型または目的指向型の人口合成をサポートする能力に制限がある。本研究では、調査データから大規模言語モデル (LLMs) を用いて個人表現テキストを派生し、意味埋め込みに変換することで、意味条件付きかつ制御可能な人口合成フレームワークである SemaPop を提案する。SemaPop は、統計制約の下で制御可能な人口生成を可能にする。我々は、分布の整合性を保持するためにマージナル制約を加えた GAN ベースのアーキテクチャを、該フレームワークをインスタント化している。大規模な実験结果显示,SemaPop は生成性能を大幅に向上させ、目的の边缘分布と共分散分布との一致度を高める一方で、意味的条件下のサンプルレベルでの実現可能性と多様性を保っている。反事実解析は、さらに、意味的な介入が生成された人口に体系的かつ解釈可能なシフトをもたらすことを示している。これらの結果は、制御可能かつシナリオ指向の人口合成における、個人表現に基づく意味条件付けの可能性を強調している。
Original Content
arXiv:2602.11569v2 Announce Type: replace
Abstract: Population synthesis is essential for individual-level simulation in transport planning and socio-economic analysis, yet remains challenging due to the need to capture both statistical dependencies and high-level behavioral semantics. Existing data-driven approaches predominantly rely on unconditional generation, limiting their ability to support scenario-driven or target-oriented population synthesis. This study proposes SemaPop, a semantic-conditioned and controllable population synthesis framework that introduces persona representations as conditioning signals for generation. By deriving persona text from survey data using large language models (LLMs) and encoding it into semantic embeddings, SemaPop enables controllable population generation under statistical constraints. We instantiate the framework using a GAN-based architecture with marginal regularization to preserve distributional consistency. Extensive experiments demonstrate that SemaPop substantially improves generative performance, yielding closer alignment with target marginal and joint distributions while maintaining sample-level feasibility and diversity under semantic conditioning. Counterfactual analyses further demonstrate that semantic interventions induce systematic and interpretable shifts in generated populations. These results highlight the potential of persona-based semantic conditioning for controllable and scenario-oriented population synthesis.