Back to list
PTB-XL-Image-17K: 大規模な合成 ECG イメージデータセットと、深層学習ベースの数字化化に不可欠な包括的な真の信号データ
PTB-XL-Image-17K: A Large-Scale Synthetic ECG Image Dataset with Comprehensive Ground Truth for Deep Learning-Based Digitization
Translated: 2026/3/15 18:03:03
Japanese Translation
arXiv:2602.07446v1 Announce Type: new
要旨: 電子心電図(ECG)の数字化化(紙製のまたはスキャンした ECG イメージを時系列信号に戻す作業)は、現代の深層学習応用に数十年にわたるレガシー臨床データを活用する上で不可欠です。ただし、ECG イメージとその対応する包括的なアノテーション付きの真の信号を両方提供する大規模なデータセットの不足により、その進展が妨げられていました。本稿では、PTB-XL 信号データベースから生成された 17,271 組の高品質な 12 導管 ECG イメージを備えた完全な合成 ECG イメージデータセット「PTB-XL-Image-17K」を導入します。当データセットは、1 サンプルあたり 5 つの補完的なデータタイプを独自に提供します:(1) 本物のグリッドパターンのアノテーション付き(50% はグリッドが可視、50% は非可視)の実用的な ECG イメージ、(2) ピxel 分割マスク、(3) 真の時系列信号、(4) YOLO 形式のバウンディングボックスアノテーション(導管領域および導管名称ラベル)、および (5) 視覚パラメータと患者情報を含む包括的なメタデータです。我々は、ペーパースピード(25/50 mm/s)、電圧スケール(5/10 mm/mV)、サンプリングレート(500 Hz)、グリッドの外観(4 カラータ)、および波形特性を含む可制御パラメータを備えたカスタマイズ可能なデータセット生成を可能にするオープンソース Python フレームワークを提示します。このデータセットは 100% の生成成功率を達成し、平均処理時間は 1.35 秒/サンプルです。「PTB-XL-Image-17K」は、導管検出、波形分割、および信号抽出を含む完全なパイプラインをサポートする最初の大規模なリソースを提供することで、ECG 数字化化研究における重要なギャップを解決します。データセット、生成フレームワーク、およびドキュメントは、https://github.com/naqchoalimehdi/PTB-XL-Image-17K および https://doi.org/10.5281/zenodo.18197519 に公開されています。
Original Content
arXiv:2602.07446v1 Announce Type: new
Abstract: Electrocardiogram (ECG) digitization-converting paper-based or scanned ECG images back into time-series signals-is critical for leveraging decades of legacy clinical data in modern deep learning applications. However, progress has been hindered by the lack of large-scale datasets providing both ECG images and their corresponding ground truth signals with comprehensive annotations. We introduce PTB-XL-Image-17K, a complete synthetic ECG image dataset comprising 17,271 high-quality 12-lead ECG images generated from the PTB-XL signal database. Our dataset uniquely provides five complementary data types per sample: (1) realistic ECG images with authentic grid patterns and annotations (50% with visible grid, 50% without), (2) pixel-level segmentation masks, (3) ground truth time-series signals, (4) bounding box annotations in YOLO format for both lead regions and lead name labels, and (5) comprehensive metadata including visual parameters and patient information. We present an open-source Python framework enabling customizable dataset generation with controllable parameters including paper speed (25/50 mm/s), voltage scale (5/10 mm/mV), sampling rate (500 Hz), grid appearance (4 colors), and waveform characteristics. The dataset achieves 100% generation success rate with an average processing time of 1.35 seconds per sample. PTB-XL-Image-17K addresses critical gaps in ECG digitization research by providing the first large-scale resource supporting the complete pipeline: lead detection, waveform segmentation, and signal extraction with full ground truth for rigorous evaluation. The dataset, generation framework, and documentation are publicly available at https://github.com/naqchoalimehdi/PTB-XL-Image-17K and https://doi.org/10.5281/zenodo.18197519.