Back to list
arxiv_cs_ai 2026年4月24日

腫瘍治療計画のための臨床推論 AI:多分野における事例ベースの評価

Clinical Reasoning AI for Oncology Treatment Planning: A Multi-Specialty Case-Based Evaluation

Translated: 2026/4/24 20:20:33
onco-brainclinical-aioncologyllmmedical-evaluation

Japanese Translation

arXiv:2604.20869v1 Announce Type: cross 【背景】米国におけるがん治療の 80% 以上は、過渡率(生存率が学術機関中心より劣る)のコミュニティ施設で行われています。臨床医は、ゲノム情報、ステージ分類、放射線画像、病理学的検査、および変更されるガイドラインを統合しなければならず、認知的な負荷が生じます。本研究では、腫瘍治療計画生成のための AI 臨床推論プラットフォーム OncoBrain を、OGI(人工知能が医学の革新)への早期ステップとして評価しました。 【方法】OncoBrain は、汎用型 LLM を基盤とし、がん特化型のグラフ検索増強生成(GraphRAG)レイヤー、長期記憶とするゴールドスタンダードな治療計画コーパス、およびハルシネーション検出・抑制のためのモデル非依存型安全層(CHECK)を組み合わせています。本研究では、婦人科系、泌尿生殖系、腫瘍神経学、消化管・肝臓胆管系、血液系悪性の 5 領域を対象とした、臨床医が補完した事例要約を評価しました。3 つの臨床医グループが、一般的な 16 項目の尺度を用いて 173 の事例を対象とした構造化評価を実施しました:専門腫瘍医 50 件、医学生 78 件、高度実践的提供者 45 件。 【結果】科学的正確性、根拠支持、安全性の評価が最も高く、ワークフロー統合および時間節約のスコアは低めですが良好でした。5 点尺度において、専門腫瘍医、医学生、高度実践的提供者における根拠およびガイドラインとの整合性の平均値はそれぞれ 4.60、4.56、4.70 でした。安全あるいは誤情報の懸念がないスコアの平均値は、それぞれ 4.80、4.40、4.60 です。ワークフロー統合の平均は 4.50、3.94、4.00 であり、推測される時間節約の平均はそれぞれ 5.00、3.89、3.60 です。 【結論】この多分野の事例ベース評価において、OncoBrain はガイドラインに適合し、臨床的に許容可能で監督が容易な腫瘍治療計画を生成しました。これらの見解は、慎重に設計された AI 推論プラットフォームが腫瘍治療計画を支援する可能性を支持し、コミュニティ施設における将来的なリアルワールド評価の正当性を示しています。

Original Content

arXiv:2604.20869v1 Announce Type: cross Abstract: Background: More than 80% of U.S. cancer care is delivered in community settings, where survival remains worse than at academic centers. Clinicians must integrate genomics, staging, radiology, pathology, and changing guidelines, creating cognitive burden. We evaluated OncoBrain, an AI clinical reasoning platform for oncology treatment-plan generation, as an early step toward OGI. Methods: OncoBrain combines general-purpose LLMs with a cancer-specific graph retrieval-augmented generation layer, a gold-standard treatment-plan corpus as long-term memory, and a model-agnostic safety layer (CHECK) for hallucination detection and suppression. We evaluated clinician-enriched case summaries across gynecologic, genitourinary, neuro-oncology, gastrointestinal/hepatobiliary, and hematologic malignancies. Three clinician groups completed structured evaluations of 173 cases using a common 16-item instrument: subspecialist oncologists reviewed 50 cases, physician reviewers 78, and advanced practice providers 45. Results: Ratings were highest for scientific accuracy, evidence support, and safety, with lower but favorable scores for workflow integration and time savings. On a 5-point scale, mean alignment with evidence and guidelines was 4.60, 4.56, and 4.70 across subspecialists, physician reviewers, and advanced practice providers. Mean scores for absence of safety or misinformation concerns were 4.80, 4.40, and 4.60. Workflow integration averaged 4.50, 3.94, and 4.00; perceived time savings averaged 5.00, 3.89, and 3.60. Conclusions: In this multi-specialty vignette-based evaluation, OncoBrain generated oncology treatment plans judged guideline-concordant, clinically acceptable, and easy to supervise. These findings support the potential of a carefully engineered AI reasoning platform to assist oncology treatment planning and justify prospective real-world evaluation in community settings.