Back to list
一般目的 3D 医学セグメンテーションにおけるモダリティ不一致と一般化の幻の解明
Uncovering Modality Discrepancy and Generalization Illusion for General-Purpose 3D Medical Segmentation
Translated: 2026/3/15 18:05:14
Japanese Translation
arXiv:2602.07643v1 発表タイプ:新しい
要旨:最近の 3D 医学基礎モデルは汎用的なツールとして位置づけられるようになっているものの、その検証は依然として地域画像や構造化画像に限定されており、モダリティ不一致に関する重要な研究が未踏歩です。厳密かつ客観的な評価を提供するため、私々は 490 例の全体型 PET/CT 画像と 464 例の全体型 PET/MRI 画像(約 675 万枚の 2D 画像、約 12 千件の 3D 臓器注釈)を含む UMD データセットを編成し、代表的な 3D セグメンテーション基礎モデルの包括的な評価を行いました。内被験者比較に基づき、撮影モードを主要な独立変数として設定し、モデルの実際のアプリケーションにおける強靭性を評価しました。私たちの評価では、文헌で報告されたベンチマークと実世界的な効率の間には、構造化ドメインから機能ドメインへ移行した場合に特に顕著な不一致が存在することが明らかになりました。これらのシステム的な失敗は、現在の 3D 基礎モデルが真に汎用的なステータスに達するには遥か遠いことを示しており、理想化したベンチマーキングと包括的な臨床的有用性の間のギャップを埋めるためには、マルチモーダルトレーニングと評価へのパラダイムシフトが必要であることを示しています。このデータセットおよび分析は、真にモダリティ不可視の医学基礎モデルを開発するための未来研究の基盤となっています。
Original Content
arXiv:2602.07643v1 Announce Type: new
Abstract: While emerging 3D medical foundation models are envisioned as versatile tools with offer general-purpose capabilities, their validation remains largely confined to regional and structural imaging, leaving a significant modality discrepancy unexplored. To provide a rigorous and objective assessment, we curate the UMD dataset comprising 490 whole-body PET/CT and 464 whole-body PET/MRI scans ($\sim$675k 2D images, $\sim$12k 3D organ annotations) and conduct a thorough and comprehensive evaluation of representative 3D segmentation foundation models. Through intra-subject controlled comparisons of paired scans, we isolate imaging modality as the primary independent variable to evaluate model robustness in real-world applications. Our evaluation reveals a stark discrepancy between literature-reported benchmarks and real-world efficacy, particularly when transitioning from structural to functional domains. Such systemic failures underscore that current 3D foundation models are far from achieving truly general-purpose status, necessitating a paradigm shift toward multi-modal training and evaluation to bridge the gap between idealized benchmarking and comprehensive clinical utility. This dataset and analysis establish a foundational cornerstone for future research to develop truly modality-agnostic medical foundation models.