Back to list
長期音声バイオマーカーを用いたパーキンソン病の進行予測:統計的および神経混合効果モデルの比較研究
Modeling Parkinson's Disease Progression Using Longitudinal Voice Biomarkers: A Comparative Study of Statistical and Neural Mixed-Effects Models
Translated: 2026/4/20 11:06:49
Japanese Translation
arXiv:2507.20058v3 Announce Type: replace-cross
Abstract: パーキンソン病(PD)の進行予測は個別化治療のために不可欠であり、音声バイオマーカーはテレモニタリングを通じて症状の重症度を追跡するための有望な非侵襲的アプローチを提供しています。しかし、この縦軸データ解析は、固有の被験者内相関、臨床試験で典型的なサンプルサイズの小ささ、および複雑な患者固有の進行パターンのために挑戦的です。深度学習は理論的な柔軟性を高く持ちますが、それらの応用は従来の統計的手法と比較して、小規模縦軸研究において依然として十分に探求されていません。本研究では、神経混合効果(NME)フレイムワークのパーキンソン病テレモニタリングへの応用を提示し、それを一般的な神経ネットワーク混合モデル(GNMM)と半パラメトリックな統計的基準である一般化加算混合モデル(GAMMs)とベンチマーク化します。オックスフォードパーキンソン病テレモニタリング音声データセットを用いて、 neural アーキテクチャが柔軟性を持つのに対し、小サンプルレジームでは著しい過学習に陥ることを示しました。当社の結果は、GAMMs が最適なバランスを提供することを示し、神経ベースラインと比べて優れた予測精度(MSE 6.56)を達成し、臨床的な解釈性を保ちます。これらの発見は、データ希少性が制約となる環境で堅牢で導入可能なテレモニタリングシステムの開発に重大な含意を持ち、神経モデルの検証のためにより大型で多様なデータセットの必要性を強調しています。
Original Content
arXiv:2507.20058v3 Announce Type: replace-cross
Abstract: Predicting Parkinson's Disease (PD) progression is crucial for personalized treatment, and voice biomarkers offer a promising non-invasive method for tracking symptom severity through telemonitoring. However, analyzing this longitudinal data is challenging due to inherent within-subject correlations, the small sample sizes typical of clinical trials, and complex patient-specific progression patterns. While deep learning offers high theoretical flexibility, its application to small-cohort longitudinal studies remains under-explored compared to traditional statistical methods. This study presents an application of the Neural Mixed Effects (NME) framework to Parkinson's telemonitoring, benchmarking it against Generalized Neural Network Mixed Models (GNMM) and semi-parametric statistical baseline of Generalized Additive Mixed Models (GAMMs). Using the Oxford Parkinson's telemonitoring voice dataset (), we demonstrate that while neural architectures offer flexibility, they are prone to significant overfitting in small-sample regimes. Our results indicate that GAMMs provide the optimal balance, achieving superior predictive accuracy (MSE 6.56) compared to neural baselines (MSE > 90) while maintaining clinical interpretability. We discuss the critical implications of these findings for developing robust, deployable telemonitoring systems where data scarcity is a constraint, highlighting the necessity for larger, diverse datasets for neural model validation.