Back to list
つながりの発見:マルチテーブルシステマティックデータの文脈におけるメンバーシップ推論攻撃
Finding Connections: Membership Inference Attacks for the Multi-Table Synthetic Data Setting
Translated: 2026/3/15 13:03:49
Japanese Translation
arXiv:2602.07126v1 発表タイプ:新しい
要旨:システマティックな行列データは、プライバシーを考慮したデータ共有を可能にするため注目を集めています。単一テーブルのシステマティック生成において、データが行やアイテムレベルでモデル化される点で決定的な進歩が遂げられましたが、ほとんどの実世界のデータは関係データベース上に存在し、ユーザーの情報は相互に関連付けられた複数のテーブルのアイテムにまたがるためです。最近、この複雑さを解決するためのシステマティックな関係データベース生成技術の進展が見られますが、これらのデータのリリースは、情報の漏洩が単一のアイテムだけでなく、完全なユーザーエンティティを構成する関係を通じて起こるという独自のプライバシー課題を伴います。
これを解決するために、私たちはシステマティックな関係データベースの経験的なユーザーレベルのプライバシーを監査するための新しいメンバーシップ推論攻撃(MIA)の枠組みを提案し、単一テーブルの MIAs はアイテムレベルで監査されるため、ユーザーレベルのプライバシー漏洩を過小評価することを示しました。その後、私たちは学習されたユーザーエンティティの表現を標的とする No-Box 脅威モデルにおける新しい敵対的攻撃、マルチテーブルメンバーシップ推論攻撃(MT-MIA)を提案しました。MT-MIA は、ユーザーに関連付けられた全てのアイテムを組み込むことで、既存の攻撃よりも、タブー間の関係によって誘発されたユーザーレベルの脆弱性をより効果的に標的にします。私たちは MT-MIA を、最先端の関係データベースシステマティックデータジェネレータにもこの脆弱性が存在することを示すために、範囲にわたる実世界のマルチテーブルデータセットで評価し、この漏洩がどこに発生するかをさらに研究するために MT-MIA を使用しました。
Original Content
arXiv:2602.07126v1 Announce Type: new
Abstract: Synthetic tabular data has gained attention for enabling privacy-preserving data sharing. While substantial progress has been made in single-table synthetic generation where data are modeled at the row or item level, most real-world data exists in relational databases where a user's information spans items across multiple interconnected tables. Recent advances in synthetic relational data generation have emerged to address this complexity, yet release of these data introduce unique privacy challenges as information can be leaked not only from individual items but also through the relationships that comprise a complete user entity.
To address this, we propose a novel Membership Inference Attack (MIA) setting to audit the empirical user-level privacy of synthetic relational data and show that single-table MIAs that audit at an item level underestimate user-level privacy leakage. We then propose Multi-Table Membership Inference Attack (MT-MIA), a novel adversarial attack under a No-Box threat model that targets learned representations of user entities via Heterogeneous Graph Neural Networks. By incorporating all connected items for a user, MT-MIA better targets user-level vulnerabilities induced by inter-tabular relationships than existing attacks. We evaluate MT-MIA on a range of real-world multi-table datasets and demonstrate that this vulnerability exists in state-of-the-art relational synthetic data generators, employing MT-MIA to additionally study where this leakage occurs.