Back to list
arxiv_cs_cv 2026年4月24日

ImageHD: ハイパースペクトル計算を用いた効率的なデバイス上継続学習の画像表現生成

ImageHD: Energy-Efficient On-Device Continual Learning of Visual Representations via Hyperdimensional Computing

Translated: 2026/4/24 19:42:10
hyperdimensional-computingon-device-learningfpga-accelerationcontinual-learningedge-ai

Japanese Translation

arXiv:2604.21280v1 Announcement Type: new Abstract: デバイス上の継続学習(CL)は、非定常データストリームを処理するエッジ AI システムにおいて不可欠ですが、既存の多くの手法は反伝播またはサンプルに依存する分類器を利用し、計算量、メモリ量、および遅延オーバーヘッドを大幅に増大させます。ハイパースペクトル計算(HDC)は、高速で反復的なオンライン更新を行うことを通じて軽量な代替案を提供します。コンパクトな畳み込みニューラルネットワーク(CNN)特徴抽出器と組み合わせることで、HDC は強力な視覚表現とともに効率的なデバイス上適応を可能にします。しかし、従来の HDC ベース CL システムは、マルチティアメモリ階層や複雑なクラスタ管理に依存しており、リソース制約のあるハードウェアでのデプロイを制限しています。 本研究では、HDC を基礎とした視覚データのデバイス上継続学習用の FPGA アキュセラーター「ImageHD」を提示します。ImageHD は厳格な遅延とオンチップメモリ制約下におけるストリーミング CL を標的とし、高コストな反復最適化を回避します。アルゴリズムレベルでは、統一されたサンプルメモリとハードウェア効率的なクラスタ合併戦略を用いてクラスサンプルを制限しつつ、精度を損なわないようにデプロイオーバーヘッドを削減するために量子化された CNN フロントエンドを含むハードウェアアウェアな CL 手法を提案します。システムレベルでは、ImageHD は AMD Zynq ZCU104 FPGA 上でストリーミングデータフローアーキテクチャとして実装され、単語パッキングされた二進数ハイパベクターを用いてオンチップリソースの厳密な予算内で大規模に並列なビット演算を実行し、HDC エンコーディング、類似性検索、および制限されたクラスタ管理を統合します。CORe50 における実験結果により、ImageHD は最適化された CPU(GPU)ベースラインと比較して最大 40.4 倍(4.84 倍)の高速化と 383 倍(105.1 倍)のエネルギー効率を達成し、HDC 能動継続学習がリアルタイムエッジ AI での実用性を示しました。

Original Content

arXiv:2604.21280v1 Announce Type: new Abstract: On-device continual learning (CL) is critical for edge AI systems operating on non-stationary data streams, but most existing methods rely on backpropagation or exemplar-heavy classifiers, incurring substantial compute, memory, and latency overheads. Hyperdimensional computing (HDC) offers a lightweight alternative through fast, non-iterative online updates. Combined with a compact convolutional neural network (CNN) feature extractor, HDC enables efficient on-device adaptation with strong visual representations. However, prior HDC-based CL systems often depend on multi-tier memory hierarchies and complex cluster management, limiting deployability on resource-constrained hardware. We present ImageHD, an FPGA accelerator for on-device continual learning of visual data based on HDC. ImageHD targets streaming CL under strict latency and on-chip memory constraints, avoiding costly iterative optimization. At the algorithmic level, we introduce a hardware-aware CL method that bounds class exemplars through a unified exemplar memory and a hardware-efficient cluster merging strategy, while incorporating a quantized CNN front-end to reduce deployment overhead without sacrificing accuracy. At the system level, ImageHD is implemented as a streaming dataflow architecture on the AMD Zynq ZCU104 FPGA, integrating HDC encoding, similarity search, and bounded cluster management using word-packed binary hypervectors for massively parallel bitwise computation within tight on-chip resource budgets. On CORe50, ImageHD achieves up to 40.4x (4.84x) speedup and 383x (105.1x) energy efficiency over optimized CPU (GPU) baselines, demonstrating the practicality of HDC-enabled continual learning for real-time edge AI.