Back to list
GEMM-GS: Tensor コアによる 3D ガウス splatting の加速への GEMM 互換なブレンド適用
GEMM-GS: Accelerating 3D Gaussian Splatting on Tensor Cores with GEMM-Compatible Blending
Translated: 2026/4/7 11:48:16
Japanese Translation
arXiv:2604.02120v2 Announce Type: replace-cross
サブレット:
ニュートラルレディアンスフィールド (NeRF) は、2D 画像から 3D シーンを再構築しますが、ポイントサンプリング設計により高レンダリング遅延を伴います。3D ガウス splatting (3DGS) は、明示的なシーレン Representation と最適化されたパイプラインを通じて NeRF を改善しましたが、依然として実用的なリアルタイム要件を満たしていません。既存の加速手法は、現代的な GPU の進化している Tensor コアを無視しており、3DGS パイプラインに General Matrix Multiplication (GEMM) オペレーションが含まれていないためです。
本稿では、GEMM-GS と呼ばれるアプローチを提案します。このアプローチは、Tensor コアを GPU 上で GEMM 互換のブレンド変換を通じて利用します。3DGS のブレンド処理を同等に GEMM 互換の形式に再構成し、Tensor コアを利用します。高パフォーマンスの CUDA カーネルを設計し、計算とメモリアccess をオーバーラップさせる 3 ステージのダブルバッファリングパイプラインを統合します。大規模な実験により、GEMM-GS は標準的な 3DGS よりも $1.42$ 倍の速度向上を実現し、既存の加速手法を組み合わせる平均的な $1.47$ 倍の追加速度向上を提供することを示しました。コードは https://github.com/shieldforever/GEMM-GS に公開されています。
Original Content
arXiv:2604.02120v2 Announce Type: replace-cross
Abstract: Neural Radiance Fields (NeRF) enables 3D scene reconstruction from several 2D images but incurs high rendering latency via its point-sampling design. 3D Gaussian Splatting (3DGS) improves on NeRF with explicit scene representation and an optimized pipeline yet still fails to meet practical real-time demands. Existing acceleration works overlook the evolving Tensor Cores of modern GPUs because 3DGS pipeline lacks General Matrix Multiplication (GEMM) operations. This paper proposes GEMM-GS, an acceleration approach utilizing tensor cores on GPUs via GEMM-friendly blending transformation. It equivalently reformulates the 3DGS blending process into a GEMM-compatible form to utilize Tensor Cores. A high-performance CUDA kernel is designed, integrating a three-stage double-buffered pipeline that overlaps computation and memory access. Extensive experiments show that GEMM-GS achieves $1.42\times$ speedup over vanilla 3DGS and provides an additional $1.47\times$ speedup on average when combining with existing acceleration approaches. Code is released at https://github.com/shieldforever/GEMM-GS.