Back to list
Tabular Biomedical データを用いた早期パーキンソン病検出のための Attention ベースのディープ学習
Attention-Based Deep Learning for Early Parkinson's Disease Detection with Tabular Biomedical Data
Translated: 2026/3/15 14:49:31
Japanese Translation
arXiv:2602.07933v1 Announce Type: new
**要約**
早期かつ精度高いパーキンソン病(PD)の診断は、初期症状の微妙さおよび生体データに内在する複雑な非線形関係ゆえに、医療診断の面で依然として重要な課題です。従来の機械学習(ML)モデルは広くPDの検出に応用されていますが、広範な特徴量設計に依存し、複雑な特徴間の相互作用を捉えることに苦慮することがあります。本研究は、タブラー(テーブル形式)の生体データを対象とした早期PD検出のための Attention ベースのディープ学習モデルの有効性を検討しました。4 つの分類モデル(Multi-Layer Perceptron (MLP)、Gradient Boosting、TabNet、SAINT)について、UCI Machine Learning リポジトリから提供されるパーキンソン病患者および健康制御群の生体音声測定値を含むベンチマークデータセットを用いて比較評価を行いました。
実験結果において、SAINT モデルは複数評価指標において全てのベースラインモデルを圧倒的に上回りました。具体的には、重み付き精度 0.98、重み付き再現率 0.97、重み付き F1 スコア 0.97、Matthews Correlation Coefficient (MCC) 0.9990、および最も高い Area Under the ROC Curve (AUC-ROC) を達成しました。TabNet および MLP モデルは競争的な性能を示しましたが、Gradient Boosting は全体的なスコアで最低の結果となりました。SAINT の卓越した性能は、サンプル内およびサンプル間で特徴相互作用を効果的にモデル化する双方向注意力メカニズムに起因すると考えられます。
これらの見解は、Attention ベースのディープ学習アーキテクチャが早期パーキンソン病検出における診断可能性を示し、臨床予測タスクにおける動的な特徴量表現の重要性を強調しています。
Original Content
arXiv:2602.07933v1 Announce Type: new
Abstract: Early and accurate detection of Parkinson's disease (PD) remains a critical challenge in medical diagnostics due to the subtlety of early-stage symptoms and the complex, non-linear relationships inherent in biomedical data. Traditional machine learning (ML) models, though widely applied to PD detection, often rely on extensive feature engineering and struggle to capture complex feature interactions. This study investigates the effectiveness of attention-based deep learning models for early PD detection using tabular biomedical data. We present a comparative evaluation of four classification models: Multi-Layer Perceptron (MLP), Gradient Boosting, TabNet, and SAINT, using a benchmark dataset from the UCI Machine Learning Repository consisting of biomedical voice measurements from PD patients and healthy controls.
Experimental results show that SAINT consistently outperformed all baseline models across multiple evaluation metrics, achieving a weighted precision of 0.98, weighted recall of 0.97, weighted F1-score of 0.97, a Matthews Correlation Coefficient (MCC) of 0.9990, and the highest Area Under the ROC Curve (AUC-ROC). TabNet and MLP demonstrated competitive performance, while Gradient Boosting yielded the lowest overall scores. The superior performance of SAINT is attributed to its dual attention mechanism, which effectively models feature interactions within and across samples.
These findings demonstrate the diagnostic potential of attention-based deep learning architectures for early Parkinson's disease detection and highlight the importance of dynamic feature representation in clinical prediction tasks.