Back to list
HypEHR: クライニカルデータ階層構造を効率的にクエリ応答する電子健康記録の双曲幾何学モデル
HypEHR: Hyperbolic Modeling of Electronic Health Records for Efficient Question Answering
Translated: 2026/4/24 20:15:08
Japanese Translation
arXiv:2604.21027v1 Announce Type: new
摘要: 電子健康記録(EHR)による質問応答は、通常、高コストで本格的に導入が困難な LLM ベースのパイプラインによって処理されており、臨床データの階層構造を明示的に活用していない。医療オントロジーや患者の経路が双曲幾何学を示すという証拠に基づき、私々は双曲空間にコード、診療経過、質問を埋め込み、タイプに特化したポインターヘッドを用いた幾何学的に整合したクロスアテンションを通じてクエリを応答する、コンパクトなローレンツィアンモデルである HypEHR を提案する。HypEHR は、ICD オントロジーと一致させるために、次の診察における診断予測と階層感知による正規化を用いて事前トレーニングを行っている。MIMIC-IV に基づいた 2 つの EHR-QA ベンチマークにおいて、HypEHR は LLM ベースの手法に接近し、同時にはるかに少ないパラメータ数で実装している。当社のコードは https://github.com/yuyuliu11037/HypEHR に公開されている。
Original Content
arXiv:2604.21027v1 Announce Type: new
Abstract: Electronic health record (EHR) question answering is often handled by LLM-based pipelines that are costly to deploy and do not explicitly leverage the hierarchical structure of clinical data. Motivated by evidence that medical ontologies and patient trajectories exhibit hyperbolic geometry, we propose HypEHR, a compact Lorentzian model that embeds codes, visits, and questions in hyperbolic space and answers queries via geometry-consistent cross-attention with type-specific pointer heads. HypEHR is pretrained with next-visit diagnosis prediction and hierarchy-aware regularization to align representations with the ICD ontology. On two MIMIC-IV-based EHR-QA benchmarks, HypEHR approaches LLM-based methods while using far fewer parameters. Our code is publicly available at https://github.com/yuyuliu11037/HypEHR.