Back to list
arxiv_cs_cv 2026年4月20日

LP$^{2}$DH: 時空間保持型ピクセル差分ハッシングを用いたダイナミックテクチャ認識の枠組み

LP$^{2}$DH: A Locality-Preserving Pixel-Difference Hashing Framework for Dynamic Texture Recognition

Translated: 2026/4/20 10:41:42
dynamic-texture-recognitionpixel-difference-vectorsstiefel-manifolddictionary-learningfeature-extraction

Japanese Translation

arXiv:2604.15707v1 Announce Type: new 要約:時空間ローカルバイナリーパターン (STLBP) は広く利用されているダイナミックテクチャ記述子であるが、極めて高い次元数を持つという課題を抱えている。これを克服するため、STLBP 特徴量は通常、3 つの直交平面に抽出されており、これにより平面間の相関関係が犠牲となっている。本稿では、全時空間近傍におけるピクセル差分を同時に符号化する、ローカル保持型ピクセル差分ハッシング (LP$^{2}$DH) フレームワークを提案する。LP$^{2}$DH はピクセル差分ベクトル (PDV) を、最大識別力を備えたコンパクトな二値コードに変換する。さらに、ハッシング前後における PDV の局所構造を維持するために、局所保持埋め込みを統合する。その後、階調降下流路上の検索戦略を用いることで、二値コードと符号化行列を Stiefel 多辺体上における勾配降下法で最適化する。ハッシング後にディクショナリ学習を適用し、二値ベクトルを符号語に符号化し、得られたヒストグラムを最終的な特徴量表現として利用する。提案した LP$^{2}$DH は、3 つの主要なダイナミックテクチャ認識ベンチマークにおいて State-of-the-art 性能を示した:UCLA で DT-GoogleNet の 98.93% に対し 99.80%、DynTex++ で HoGF$^{3D}$ の 97.63% に対し 98.52%、YUPENN で STS の 95.00% に対し 96.19% である。ソースコードは以下で入手可能:https://github.com/drx770/LP2DH

Original Content

arXiv:2604.15707v1 Announce Type: new Abstract: Spatiotemporal Local Binary Pattern (STLBP) is a widely used dynamic texture descriptor, but it suffers from extremely high dimensionality. To tackle this, STLBP features are often extracted on three orthogonal planes, which sacrifice inter-plane correlation. In this work, we propose a Locality-Preserving Pixel-Difference Hashing (LP$^{2}$DH) framework that jointly encodes pixel differences in the full spatiotemporal neighbourhood. LP$^{2}$DH transforms Pixel-Difference Vectors (PDVs) into compact binary codes with maximal discriminative power. Furthermore, we incorporate a locality-preserving embedding to maintain the PDVs' local structure before and after hashing. Then, a curvilinear search strategy is utilized to jointly optimize the hashing matrix and binary codes via gradient descent on the Stiefel manifold. After hashing, dictionary learning is applied to encode the binary vectors into codewords, and the resulting histogram is utilized as the final feature representation. The proposed LP$^{2}$DH achieves state-of-the-art performance on three major dynamic texture recognition benchmarks: 99.80% against DT-GoogleNet's 98.93% on UCLA, 98.52% against HoGF$^{3D}$'s 97.63% on DynTex++, and 96.19% compared to STS's 95.00% on YUPENN. The source code is available at: https://github.com/drx770/LP2DH.