Back to list
医療画像解析のための微分プライバシー表現幾何学
Differential privacy representation geometry for medical image analysis
Translated: 2026/4/20 10:51:13
Japanese Translation
論文: arXiv:2603.01098v2 アナウンス タイプ: 更新
要約: 微分プライバシー(DP)の影響は、一般的にエンド・トゥ・エンドのパフォーマンスを通じてのみ評価されており、プライバシーによる効率的な損失のメカニズムが明確ではありません。本研究では、「医療画像解析用微分プライバシー表現幾何学(DP-RGMI)」というフレームワークを導入し、DP を表現空間の構造化された変換とみなし、性能の低下をエンコーダー幾何学とタスクヘッドの利用率に分解します。幾何学は、初期化からの表現位移とスペクトル有効次元で定量化され、利用率は線形プローブ利用とエンド・トゥ・エンド利用のギャップとして測定されます。4 つの胸部 X 線データセットおよび多数の事前トレーニング初期化に基づく 594,000 枚以上の画像を対象とした分析において、DP が線形分離性が大きく保持されていても一貫して利用率ギャップに関連していることを示しました。同時に、位移とスペクトル次元は初期化とデータセットに依存する単調ではなく、再整形を示しており、これは DP が特徴の非均質性を変化させ、均一の特徴の崩壊をもたらすとは異なることを示唆しています。相関分析により、エンド・トゥ・エンド性能と利用率の関連性はデータセット間で頑健であるが初期化によって変動し得ることが明らかとなり、幾何学的な量は事前知識とデータセット条件付けされた追加の変異を捉えます。これらの見解は、DP-RGMI を、プライバシー誘発的な失敗モードの診断とプライバシーモデル選択の支援のための再現性の高いフレームワークと位置づけます。
Original Content
arXiv:2603.01098v2 Announce Type: replace
Abstract: Differential privacy (DP)'s effect in medical imaging is typically evaluated only through end-to-end performance, leaving the mechanism of privacy-induced utility loss unclear. We introduce Differential Privacy Representation Geometry for Medical Imaging (DP-RGMI), a framework that interprets DP as a structured transformation of representation space and decomposes performance degradation into encoder geometry and task-head utilization. Geometry is quantified by representation displacement from initialization and spectral effective dimension, while utilization is measured as the gap between linear-probe and end-to-end utility. Across over 594,000 images from four chest X-ray datasets and multiple pretrained initializations, we show that DP is consistently associated with a utilization gap even when linear separability is largely preserved. At the same time, displacement and spectral dimension exhibit non-monotonic, initialization- and dataset-dependent reshaping, indicating that DP alters representation anisotropy rather than uniformly collapsing features. Correlation analysis reveals that the association between end-to-end performance and utilization is robust across datasets but can vary by initialization, while geometric quantities capture additional prior- and dataset-conditioned variation. These findings position DP-RGMI as a reproducible framework for diagnosing privacy-induced failure modes and informing privacy model selection.