Back to list
TransConv-DDPM: Biomedical 時系列データ生成に特化した拡張型ディフュージョンモデル
TransConv-DDPM: Enhanced Diffusion Model for Generating Time-Series Data in Healthcare
Translated: 2026/3/15 13:03:24
Japanese Translation
arXiv:2602.07033v1 Announce Type: new
本稿では、臨床分野における実世界データ不足が、診断および予防医療用の AI モデルの訓練に重大な障害となっていることを指摘します。生成 AI は、特にコンピュータビジョンおよび自然言語処理(NLP)分野において、データ量の増大とモデル訓練の強化に期待されていますが、医療 AI 応用において共通型の生理学的時系列データを生成することは、その内生的な複雑性と変異性ゆえに独自の課題を伴います。本稿は、生物力学および生理学的時系列データ生成に特化した拡張型生成 AI メソッド「TransConv-DDPM」を提案します。このモデルは、ノイズ除去拡散確率的モデル(DDPM)に U-Net、マルチスケール畳み込みモジュール、およびトランスフォーマーレイヤーを組み合わせた構成であり、時間的な依存関係におけるグローバルな傾向とローカルの両方を捉えます。TransConv-DDPM の評価では、3 つの多様なデータセットを用い、長編および短編の時系列データを生成しました。状態の最善レベルの手法である TimeGAN および Diffusion-TS との定量的比較では、4 つの性能指標を用いた評価により、SmartFallMM および EEG データセットにおいて、データポイント間のより緩やかな時間変化パターンを効果的に捉えることが示されました。さらに、SmartFallMM データセットにおける実用性テストでは、TransConv-DDPM で生成された合成の落下データを追加することで、予測モデルの性能が向上し、F1 スコアで 13.64%、総合精度で 14.93% 増大という結果となりました。これらの知見は、TransConv-DDPM が、実世界的应用に高品質な合成データを生成する潜在的な能力を秘めていることを示唆しています。
Original Content
arXiv:2602.07033v1 Announce Type: new
Abstract: The lack of real-world data in clinical fields poses a major obstacle in training effective AI models for diagnostic and preventive tools in medicine. Generative AI has shown promise in increasing data volume and enhancing model training, particularly in computer vision and natural language processing (NLP) domains. However, generating physiological time-series data, a common type in medical AI applications, presents unique challenges due to its inherent complexity and variability. This paper introduces TransConv-DDPM, an enhanced generative AI method for biomechanical and physiological time-series data generation. The model employs a denoising diffusion probabilistic model (DDPM) with U-Net, multi-scale convolution modules, and a transformer layer to capture both global and local temporal dependencies. We evaluated TransConv-DDPM on three diverse datasets, generating both long and short-sequence time-series data. Quantitative comparisons against state-of-the-art methods, TimeGAN and Diffusion-TS, using four performance metrics, demonstrated promising results, particularly on the SmartFallMM and EEG datasets, where it effectively captured the more gradual temporal change patterns between data points. Additionally, a utility test on the SmartFallMM dataset revealed that adding synthetic fall data generated by TransConv-DDPM improved predictive model performance, showing a 13.64% improvement in F1-score and a 14.93% increase in overall accuracy compared to the baseline model trained solely on fall data from the SmartFallMM dataset. These findings highlight the potential of TransConv-DDPM to generate high-quality synthetic data for real-world applications.