Back to list
VertCoHiRF: k-means を超えた分散型垂直クラスタリング
VertCoHiRF: Decentralized Vertical Clustering Beyond k-means
Translated: 2026/3/15 13:06:02
Japanese Translation
arXiv:2602.07279v1 発表型: 新しい
要旨: 垂直連合学習 (VFL) は、同じサンプルを保有する異なる当事者間で補完的な特徴視点に基づいた協力的分析を可能にしますが、既存のアプローチはほとんどが分散型 $k$-means に制限されており、中央局の調整や特徴依存の数値統計の交換を必要とし、異質な視点や敵対的行為下でのロバスト性が低いです。私たちは、異質な視点における構造的一致に基づいた、完全に分散型垂直クラスタリングフレームワークである VertCoHiRF を導入します。VertCoHiRF は、各エージェントがピアツーピアの形でそのローカル特徴空間に適応された基本クラスタリング手法を適用することを可能にします。特徴依存の統計やノイズ挿入によるプライバシー保護に頼らず、エージェントはそのローカル視点に基づいて独立してクラスタリングを行い、アイデンティティレベルのコンセンサスを通じて提案を調和させます。コンセンサスは、代表的メロイドを選択するための分散型順序ランキングを通じて達成され、エージェント全体に共有階層クラスタリングを段階的に誘導します。通信はサンプルアイデンティティ、クラスラベル、および順序ランキングに限定されており、これはデザイン上のプライバシー提供とともに、重なる特徴分割と異質なローカルクラスタリング手法をサポートし、複数の解像度でクロスビュー一致を捉える解釈可能な共有クラスタ融合階層 (CFH) を生成します。我々は通信複雑性とロバスト性を分析し、実験は垂直連合環境での競争力のあるクラスタリング性能を示しています。
Original Content
arXiv:2602.07279v1 Announce Type: new
Abstract: Vertical Federated Learning (VFL) enables collaborative analysis across parties holding complementary feature views of the same samples, yet existing approaches are largely restricted to distributed variants of $k$-means, requiring centralized coordination or the exchange of feature-dependent numerical statistics, and exhibiting limited robustness under heterogeneous views or adversarial behavior. We introduce VertCoHiRF, a fully decentralized framework for vertical federated clustering based on structural consensus across heterogeneous views, allowing each agent to apply a base clustering method adapted to its local feature space in a peer-to-peer manner. Rather than exchanging feature-dependent statistics or relying on noise injection for privacy, agents cluster their local views independently and reconcile their proposals through identifier-level consensus. Consensus is achieved via decentralized ordinal ranking to select representative medoids, progressively inducing a shared hierarchical clustering across agents. Communication is limited to sample identifiers, cluster labels, and ordinal rankings, providing privacy by design while supporting overlapping feature partitions and heterogeneous local clustering methods, and yielding an interpretable shared Cluster Fusion Hierarchy (CFH) that captures cross-view agreement at multiple resolutions.We analyze communication complexity and robustness, and experiments demonstrate competitive clustering performance in vertical federated settings.