Back to list
arxiv_cs_cv 2026年2月10日

網膜セグメンテーションと定量化のための汎用モデル

A General Model for Retinal Segmentation and Quantification

Translated: 2026/2/11 4:22:30

Japanese Translation

arXiv:2602.07012v1 公開タイプ: new 要旨: 網膜イメージングは高速で非侵襲的、かつ広く利用可能であり、眼科および全身の健康評価に対して定量化可能な構造的および血管学的シグナルを提供する。このアクセスの容易さは、定量的な網膜フェノタイプが眼疾患や全身疾患とどのように関連するかを研究する機会を生む。しかし、公的なマルチラベルデータセットの限られた利用可能性や、セグメンテーションから定量化への統一パイプラインの欠如により、そのような解析を大規模に行うことは依然として困難である。本稿では、fundus imaging(眼底イメージング)に対する一般的な網膜セグメンテーションおよび定量化フレームワークであるRetSAMを提案する。RetSAMは堅牢なマルチターゲットセグメンテーションと標準化されたバイオマーカー抽出を提供し、下流の眼科研究やoculomics相関解析を支援する。20万枚超のfundus画像で訓練されたRetSAMは、3つのタスクカテゴリをサポートし、5つの解剖学的構造、4つの網膜表現型パターン、および20を超える異なる病変タイプをセグメントする。これらのセグメンテーション結果を30以上の標準化されたバイオマーカーに変換し、構造的形態、血管ジオメトリ、および変性変化を捉える。プライベートおよび公開の眼底データを用いた多段階学習戦略で訓練されたRetSAMは、17の公開データセットにおいて優れたセグメンテーション性能を達成する。平均でDSC(Dice Similarity Coefficient)において既存の最良手法を3.9パーセンテージポイント上回り、難しいマルチタスクベンチマークでは最大で15パーセンテージポイントの改善を示し、多様な集団、撮影機器、および臨床環境にわたって良好に一般化する。得られたバイオマーカーは、糖尿病性網膜症、加齢黄斑変性(age-related macular degeneration)、緑内障、および病的近視など主要な眼科疾患にわたる体系的な相関解析を可能にする。総じて、RetSAMは眼底画像を標準化され解釈可能な定量的フェノタイプへと変換し、大規模な眼科研究および臨床応用への橋渡しを可能にする。

Original Content

arXiv:2602.07012v1 Announce Type: new Abstract: Retinal imaging is fast, non-invasive, and widely available, offering quantifiable structural and vascular signals for ophthalmic and systemic health assessment. This accessibility creates an opportunity to study how quantitative retinal phenotypes relate to ocular and systemic diseases. However, such analyses remain difficult at scale due to the limited availability of public multi-label datasets and the lack of a unified segmentation-to-quantification pipeline. We present RetSAM, a general retinal segmentation and quantification framework for fundus imaging. It delivers robust multi-target segmentation and standardized biomarker extraction, supporting downstream ophthalmologic studies and oculomics correlation analyses. Trained on over 200,000 fundus images, RetSAM supports three task categories and segments five anatomical structures, four retinal phenotypic patterns, and more than 20 distinct lesion types. It converts these segmentation results into over 30 standardized biomarkers that capture structural morphology, vascular geometry, and degenerative changes. Trained with a multi-stage strategy using both private and public fundus data, RetSAM achieves superior segmentation performance on 17 public datasets. It improves on prior best methods by 3.9 percentage points in DSC on average, with up to 15 percentage points on challenging multi-task benchmarks, and generalizes well across diverse populations, imaging devices, and clinical settings. The resulting biomarkers enable systematic correlation analyses across major ophthalmic diseases, including diabetic retinopathy, age-related macular degeneration, glaucoma, and pathologic myopia. Together, RetSAM transforms fundus images into standardized, interpretable quantitative phenotypes, enabling large-scale ophthalmic research and translation.