Back to list
129FPS 完全フル HD 実時間レンダリングアクセラレータの提案(3D Gaussian Splatting 向け)
A 129FPS Full HD Real-Time Accelerator for 3D Gaussian Splatting
Translated: 2026/4/14 14:15:38
Japanese Translation
arXiv:2604.10223v1 Announce Type: cross
Abstract: 現実世界と仮想空間(XR)デバイスにおける大型および無限定シーンのレンダリングは、3D Gaussian Splatting(3DGS)の計算量、帯域幅、およびストレージコストに制約される。本研究では、低消費電力・低コストの 3DGS ハードウェアアクセラレータを提案し、フル HD 画像を実時間レンダリングする。これに加え、回次ガウス剪定と微調整、進捗のある球調(SH)次数削減、および全ての SH 係数とカラーのベクトル量化を組み合わせるハードウェア親和性の高い圧縮パイプラインも提案する。このスキームにより、モデルサイズは$51.6\times$削減され、PSNR は$0.743\text{ dB}$の損失が生じる。アクセラレータは、点ベースのカールイングとプロジェクションをタイルベースのソートおよびレンダリゼーションと統合したフレームレベルのパイプラインを使用し、ゼロヤコビアン行列演算をスキップする(処理要素を$63\%$、計算を$53\%$削減)。また、確実な遅延を持つ比較なしのタイルベースソートを採用する。TSMC 28-nm プロセスで$800\text{ MHz}$で実装された際、面積は$0.66~\text{mm}^2$、ゲート数は$1.1438\text{ M}$、SRAM は$120\text{ kB}$、消費電力は$0.219\text{ W}$、エネルギー効率$1219\text{ Mpixel/J}$、出力速度$267.5\text{ Mpixel/s}$となり、$1080\text{ p}$@$129\text{ FPS}$を実現する。全体として、先駆的な 3DGS アクセラレータと比較して、面積は$5.98\times$小さい、throughput は$5.94\times$高い、エネルギー効率は$7.5\times$高い性能を発揮する。
Original Content
arXiv:2604.10223v1 Announce Type: cross
Abstract: Rendering large-scale, unbounded scenes on AR/VR-class devices is constrained by the computation, bandwidth, and storage cost of 3D Gaussian Splatting (3DGS). We propose a low-power, low-cost 3DGS hardware accelerator that renders full-HD images in real time, together with a hardware-friendly compression pipeline that combines iterative Gaussian pruning and fine-tuning, progressive spherical harmonics (SH) degree reduction, and vector quantization of all SH coefficients and colors. The scheme achieves a $51.6\times$ model-size reduction with a 0.743 dB PSNR loss. The accelerator uses a frame-level pipeline that integrates point-based culling and projection with tile-based sorting and rasterization, skips zero-Jacobian matrix multiplications (reducing processing elements by 63\% and computation by 53\%), and adopts comparison-free tile-based sorting with deterministic latency. Implemented in a TSMC 28-nm process at 800 MHz, the design occupies $0.66~\text{mm}^2$ with 1.1438 M gates and 120 kB SRAM, consumes 0.219 W, and delivers 1219 Mpixels/J at 267.5 Mpixels/s, enabling 1080p at 129 FPS. Overall, it is $5.98\times$ smaller in area, $5.94\times$ higher throughput, and delivers $7.5\times$ higher energy efficiency than prior 3DGS accelerators.