Back to list
Spira: 立方体データ構造特性を活用した点雲ネットワークにおける効率的なスパース畳み込み
Spira: Exploiting Voxel Data Structural Properties for Efficient Sparse Convolution in Point Cloud Networks
Translated: 2026/4/20 11:07:22
Japanese Translation
論文: arXiv:2511.20834v2
告知タイプ: replace-cross
要約:スパース畳み込み(SpC)は、自動運転および拡張/仮想リアリティで広く利用されている 3D ポイントクラウドネットワークを牽引しています。SpC は、入力の立方体座標と出力座標、および重みオフセット間のマッピングを保存するカーネルマップを構築し、それを使用して出力座標のための特性ベクトルを計算します。我々の研究では、立方体座標の 3 つの主要な特性を特定しました:整数値であること、限られた空間範囲内に存在すること、そして幾何学的連続性を持つこと(すなわち、同一のオブジェクト表面にある隣接する立方体は、互いに小さな空間オフセットに存在する可能性が高い)です。先行する SpC エンジンでは、これらの特性が完全に活用されておらず、カーネルマップの構築中に高い前処理と後処理オーバーヘッドを被っていました。これに対処するために、我々は GPU 用の最初の立方体特性感知型 SpC エンジンである Spira を設計しました。Spira は、(i) 前処理を要せず高いデータロカリティを持ちカーネルマップを構築する高パフォーマンスなワンショット検索アルゴリズム、(ii) パックされた立方体座標を低コストでアクセスする効率的なパック ネイティブ処理スキーム、(iii) レイヤ特性に適応して出力特性ベクトルを効率的に計算する柔軟な二重データフロー実行メカニズム、(iv) ネットワーク開始時にすべての SpC レイヤのカーネルマップを並列に構築するネットワークワイド並列化戦略を提案しています。我々の評価は、Spira が多様なレイヤー構成にわたって 1.68 倍平均、2.11 倍平均、最大 3.44 倍の上昇性能を示し、エンドツーエンド推論では 3.04 倍、レイヤー毎実行では 3.44 倍まで向上するという、従来の最先进な SpC エンジンに比べて著しく優れていることを示しました。Spira のソースコードは https://github.com/SPIN-Research-Group/Spira に自由に利用可能です。
Original Content
arXiv:2511.20834v2 Announce Type: replace-cross
Abstract: Sparse Convolution (SpC) powers 3D point cloud networks widely used in autonomous driving and augmented/virtual reality. SpC builds a kernel map that stores mappings between input voxel coordinates, output coordinates, and weight offsets, then uses this map to compute feature vectors for output coordinates. Our work identifies three key properties of voxel coordinates: they are integer-valued, bounded within a limited spatial range, and geometrically continuous, i.e., neighboring voxels on the same object surface are highly likely to exist at small spatial offsets from each other. Prior SpC engines do not fully exploit these properties and suffer from high pre-processing and post-processing overheads during kernel map construction. To address this, we design Spira, the first voxel-property-aware SpC engine for GPUs. Spira proposes (i) a high-performance one-shot search algorithm that builds the kernel map with no pre-processing and high data locality, (ii) an effective packed-native processing scheme that accesses packed voxel coordinates at low cost, (iii) a flexible dual-dataflow execution mechanism that efficiently computes output feature vectors by adapting to layer characteristics, and (iv) a network-wide parallelization strategy that builds kernel maps for all SpC layers concurrently at network start. Our evaluation shows that Spira significantly outperforms prior state-of-the-art SpC engines by 1.68x on average and up to 3.04x for end-to-end inference, and by 2.11x on average and up to 3.44x for layer-wise execution across diverse layer configurations. The source code of Spira is freely available at https://github.com/SPIN-Research-Group/Spira.