Back to list
医療データにおける線形構造保持を通じた高密度特徴学習
Dense Feature Learning via Linear Structure Preservation in Medical Data
Translated: 2026/3/15 14:47:06
Japanese Translation
arXiv:2602.07706v1 発表タイプ:新規
要約: 医療データ向けの深層学習モデルは、通常、判別方向に表現を圧縮することを促すタスク固有の目標関数を使用して訓練されます。これは個別の予測問題には効果的であるが、臨床データ豊かな構造を活用し尽くしておらず、学習された特徴の転移性、安定性、解釈性を制限します。本稿では、医療埋め込みの線形構造を明示的に形成する表現中心の枠組みである「高密度特徴学習」を提案します。我々のアプローチは埋め込み行列を直接操作し、線形代数的特性のみに基づく目標関数を用いてスペクトルバランス、サブ空間一貫性、特徴直交性を促します。ラベルや生成再構築に頼らず、高密度特徴学習は有効ランクが高まり、条件数が改善し、時間を超えて安定した表現を生み出します。縦断的な EHR データ、臨床テキスト、マルチモーダル患者表現における経験的評価は、監督学習および自己教師あり学習のベースラインと比較して、後続の線形性能、頑健性、サブ空間一致において一貫した改善を示しました。これらの結果は、臨床的な変化に適用空間を学習することが、臨床的な結果を予測することを学習することに同様に重要であることを示唆し、表現幾何学を医療 AI の第一級の目標と位置づけました。
Original Content
arXiv:2602.07706v1 Announce Type: new
Abstract: Deep learning models for medical data are typically trained using task specific objectives that encourage representations to collapse onto a small number of discriminative directions. While effective for individual prediction problems, this paradigm underutilizes the rich structure of clinical data and limits the transferability, stability, and interpretability of learned features. In this work, we propose dense feature learning, a representation centric framework that explicitly shapes the linear structure of medical embeddings. Our approach operates directly on embedding matrices, encouraging spectral balance, subspace consistency, and feature orthogonality through objectives defined entirely in terms of linear algebraic properties. Without relying on labels or generative reconstruction, dense feature learning produces representations with higher effective rank, improved conditioning, and greater stability across time. Empirical evaluations across longitudinal EHR data, clinical text, and multimodal patient representations demonstrate consistent improvements in downstream linear performance, robustness, and subspace alignment compared to supervised and self supervised baselines. These results suggest that learning to span clinical variation may be as important as learning to predict clinical outcomes, and position representation geometry as a first class objective in medical AI.