Back to list
arxiv_cs_cv 2026年2月10日

增強型混合 3D 生成敵対ネットワーク:3D オブジェクトの補完と生成

Enhanced Mixture 3D CGAN for Completion and Generation of 3D Objects

Translated: 2026/3/15 19:03:58
gan3d-ganmixture-of-expertsvoxel-processingobject-completion

Japanese Translation

arXiv:2602.08046v1 発表タイプ:新 要約:3D オブジェクトの生成と補完は、コンピュータビジョンにおいて転換的な課題を表しています。生成敵対ネットワーク(GANs)は、最近、現実的な視覚データ合成において強力な潜在的力を示しました。しかし、彼らは複雑かつ多様なデータ分布を捉えることに困難を覚えていることがあり、特に不完全な入力や大幅な欠損領域を伴うシナリオにおいてはより顕著です。これらの課題は、主に高負荷の計算要件、異質な構造的に複雑なデータをモデル化する困難さから生じるものであり、実世界の設置における適用を制限しています。専門家混合(MoE)モデルは、これらの制限に対する有望な解決策として台頭しました。入力に対して最も関連する専門家サブネットワークを動的に選択し活性化させることで、MoE は性能と効率の両方を向上させます。この論文では、高品質な 3D モデルを生成し、不完全または損傷したオブジェクトを再建することを目的として、ディープ 3D 畳み込み GAN(CGAN)を MoE フレームワークと統合する方法を調査します。提案されたアーキテクチャは、データセット内の異なるモダリティを捉えるために各々が専門化された複数の生成器を含んでいます。さらに、カテゴリカル生成器の選択を導くための補助的無損失動的容量制約(DCC)メカニズムを導入され、専門化、トレーニング安定性、および計算効率の間のバランスを保証しており、これは 3D ボキセル処理において極めて重要でした。私たちは、サイズが異なる欠損領域を有する形状の生成と補完の能力を評価し、最先端のアプローチとの性能を比較しました。定量的および定性の結果は、提案された MoE-DCGAN の複雑な 3D データを処理する有効性を確認しました。

Original Content

arXiv:2602.08046v1 Announce Type: new Abstract: The generation and completion of 3D objects represent a transformative challenge in computer vision. Generative Adversarial Networks (GANs) have recently demonstrated strong potential in synthesizing realistic visual data. However, they often struggle to capture complex and diverse data distributions, particularly in scenarios involving incomplete inputs or significant missing regions. These challenges arise mainly from the high computational requirements and the difficulty of modeling heterogeneous and structurally intricate data, which restrict their applicability in real-world settings. Mixture of Experts (MoE) models have emerged as a promising solution to these limitations. By dynamically selecting and activating the most relevant expert sub-networks for a given input, MoEs improve both performance and efficiency. In this paper, we investigate the integration of Deep 3D Convolutional GANs (CGANs) with a MoE framework to generate high-quality 3D models and reconstruct incomplete or damaged objects. The proposed architecture incorporates multiple generators, each specialized to capture distinct modalities within the dataset. Furthermore, an auxiliary loss-free dynamic capacity constraint (DCC) mechanism is introduced to guide the selection of categorical generators, ensuring a balance between specialization, training stability, and computational efficiency, which is critical for 3D voxel processing. We evaluated the model's ability to generate and complete shapes with missing regions of varying sizes and compared its performance with state-of-the-art approaches. Both quantitative and qualitative results confirm the effectiveness of the proposed MoE-DCGAN in handling complex 3D data.