Back to list
arxiv_cs_gr 2026年2月10日

大規模生成された実感できる擬似的家庭データ

Realistic Synthetic Household Data Generation at Scale

Translated: 2026/2/14 6:03:32

Japanese Translation

先進的な基礎モデルの発展により、体験型AIを開発する研究が推進されています。これにより、環境に類似した思考を伴った交互作用を持つ操作可能な代理人を産み出すことが可能になります。 これらの代理人体験するには大量の大規模データセットが必要です。以前のフレームワークは長期的な人ロボット交渉での擬似的なデータ生成を用いますけど、その反対の影響も含めた人間行動と家庭環境のモデル化に失敗しています。我々が提案している生成フレームワークは、代理人事前生成との間で弱く結合した長期間の人ロボット交渉と環境の生成によって大規模な家屋データセットを生成します。 ユーザー側からは人間像から環境の生成が影響されますが、環境のサモプシーおよび語彙により代理人事務局は人間ロボット交渉に形づけられます。 生成された3Dデータには、オブジェクトや家庭環境の意味、時間的観点としての人とロボットの行動も含まれています。 機材によってユーザーは自然な言語促進を使うことでデータセットの特性を定義できますという柔軟なツールは、ユーザ定義データ配置が環境と人間活動を指定可能な特徴性を作り出します。 このツールは独自のデータ拡張物作成に利用可能で、大規模なデータ生成に取り組むユーザーにとって有用です。 適正化検証では多モダニEmbeddingを用いて統計的評価を実行し、キーキャリエッティング指標など多要素的な測定が行われました。 シートコムシミリアリティ (0. 60) と主導者データセット(HOMER)、スワップしたデータセット(王さんたち等)に対するモチーフ相性の比較から、良好な符合関係を見出すことができました。介入分析は年齢、組織構造、就寝パターンを変更して統計的に影響を与えると示し、Cohen's dという大いさくスizes(0. 51-1. 12)が大きくあり、人像の特徴が環境特性や行動的な違いに直接的につながることを確認しました。 データ生成への取り組みと、家庭向けスマートデバイスの開発テストはこれを可能にしています。

Original Content

arXiv:2602.07243v1 Announce Type: cross Abstract: Advancements in foundation models have catalyzed research in Embodied AI to develop interactive agents capable of environmental reasoning and interaction. Developing such agents requires diverse, large-scale datasets. Prior frameworks generate synthetic data for long-term human-robot interactions but fail to model the bidirectional influence between human behavior and household environments. Our proposed generative framework creates household datasets at scale through loosely coupled generation of long-term human-robot interactions and environments. Human personas influence environment generation, while environment schematics and semantics shape human-robot interactions. The generated 3D data includes rich static context such as object and environment semantics, and temporal context capturing human and agent behaviors over extended periods. Our flexible tool allows users to define dataset characteristics via natural language prompts, enabling configuration of environment and human activity data through natural language specifications. The tool creates variations of user-defined configurations, enabling scalable data generation. We validate our framework through statistical evaluation using multi-modal embeddings and key metrics: cosine similarity, mutual information gain, intervention analysis, and iterative improvement validation. Statistical comparisons show good alignment with real-world datasets (HOMER) with cosine similarity (0.60), while synthetic datasets (Wang et al.) show moderate alignment (0.27). Intervention analysis across age, organization, and sleep pattern changes shows statistically significant effects (p < 0.001) with large effect sizes (Cohen's d = 0.51-1.12), confirming bidirectional coupling translates persona traits into measurable environmental and behavioral differences. These contributions enable development and testing of household smart devices at scale.