Back to list
AROMA: 多模態アーキテクチャに対する拡張推論を用いた仮想細胞遺伝的乱乱モデル化
AROMA: Augmented Reasoning Over a Multimodal Architecture for Virtual Cell Genetic Perturbation Modeling
Translated: 2026/4/24 20:04:32
Japanese Translation
arXiv:2604.20263v1 Announce Type: cross
Abstract: 仮想細胞モデル化は、遺伝的乱打条件下での分子状態の変化をシミュレーションによって予測するもので、生物学のメカニズム研究において不可欠です。しかし、既存のアプローチは制約のない推論、解釈不能な予測、そしてレギュレーションのトポロジと整合性の低い検索シグナルという課題に悩んでいます。これらの制限を克服するため、AROMA(仮想細胞遺伝的乱打モデル化のための多模態アーキテクチャに対する拡張推論)を提案します。AROMA は、テキストエビデンス、グラフトポロジー情報、プロテイン配列特性を統合し、乱打とターゲットの依存関係をモデル化し、2 ステージ最適化戦略を適用することで、高精度かつ解釈可能な予測を生み出します。また、仮想細胞ドメインの再利用リソースとして、49 万件以上のサンプルを含む 2 つの知識グラフと乱打推論データセット PerturbReason を構築しました。実験では、AROMA は複数の細胞系において既存の手法を凌駕し、見知らぬ細胞線でのゼロショット評価、知識が不足したロングテールシナリオ下でも頑健であることを確認しました。総合的に、AROMA は、知識駆動型多模態モデル化とエビデンス検索の組み合わせが、より信頼性が高く解釈可能な仮想細胞乱打予測への有望な道筋であることを示しました。モデルの重みは https://huggingface.co/blazerye/AROMA で利用可能です。コードは https://github.com/blazerye/AROMA で利用可能です。
Original Content
arXiv:2604.20263v1 Announce Type: cross
Abstract: Virtual cell modeling predicts molecular state changes under genetic perturbations in silico, which is essential for biological mechanism studies. However, existing approaches suffer from unconstrained reasoning, uninterpretable predictions, and retrieval signals that are weakly aligned with regulatory topology. To address these limitations, we propose AROMA, an Augmented Reasoning Over a Multimodal Architecture for virtual cell genetic perturbation modeling. AROMA integrates textual evidence, graph-topology information, and protein sequence features to model perturbation-target dependencies, and is trained with a two-stage optimization strategy to yield predictions that are both accurate and interpretable. We also construct two knowledge graphs and a perturbation reasoning dataset, PerturbReason, containing more than 498k samples, as reusable resources for the virtual cell domain. Experiments show that AROMA outperforms existing methods across multiple cell lines, and remains robust under zero-shot evaluation on an unseen cell line, as well as in knowledge-sparse, long-tail scenarios. Overall, AROMA demonstrates that combining knowledge-driven multimodal modeling with evidence retrieval provides a promising pathway toward more reliable and interpretable virtual cell perturbation prediction. Model weights are available at https://huggingface.co/blazerye/AROMA. Code is available at https://github.com/blazerye/AROMA.