Back to list
アウトレグレジブレイアウト生成への 3D ジェネラティブモデルの再利用
Repurposing 3D Generative Model for Autoregressive Layout Generation
Translated: 2026/4/20 10:47:03
Japanese Translation
arXiv:2604.16299v1 Announce Type: new
要約:我々は、3D ジェネラティブモデルを 3D レイアウト生成への再利用フレームワークである「LaviGen」を紹介しました。従来のテキスト記述から物体レイアウトを推定する手法とは異なり、LaviGen はネイティブの 3D 空間内にて動作し、物体間の幾何学的関係と物理制約を明示的にモデル化するアウトレグレジブプロセスとしてレイアウト生成を定義し、一貫性があり物理的に妥当な 3D シーンの生成を行います。このプロセスをさらに向上させるため、我々はシーン、物体、指示情報を統合し、効率と空間精度を向上させるための双方向の導向自己ロールアウト蒸馏機構を採用した適応型 3D 拡散モデルを提案しました。LayoutVLM ベンチマークに基づく大規模実験により、LaviGen は最先進技術に比較して 19% も高い物理的妥当性と 65% の高速計算を実現しました。我々のコードは、https://github.com/fenghora/LaviGen で公開されています。
Original Content
arXiv:2604.16299v1 Announce Type: new
Abstract: We introduce LaviGen, a framework that repurposes 3D generative models for 3D layout generation. Unlike previous methods that infer object layouts from textual descriptions, LaviGen operates directly in the native 3D space, formulating layout generation as an autoregressive process that explicitly models geometric relations and physical constraints among objects, producing coherent and physically plausible 3D scenes. To further enhance this process, we propose an adapted 3D diffusion model that integrates scene, object, and instruction information and employs a dual-guidance self-rollout distillation mechanism to improve efficiency and spatial accuracy. Extensive experiments on the LayoutVLM benchmark show LaviGen achieves superior 3D layout generation performance, with 19% higher physical plausibility than the state of the art and 65% faster computation. Our code is publicly available at https://github.com/fenghora/LaviGen.