Back to list
Mechanistic Explainability への機械的学習:MechSMILES による言語モデルへの教授
Teaching Language Models Mechanistic Explainability Through MechSMILES
Translated: 2026/4/20 11:04:46
Japanese Translation
arXiv:2512.05722v2 Announce Type: replace
要約:化学反応の機構は、化学家が反応性や実現性を評価するための基盤でありながら、現在のコンピュータ支援合成計画(CASP)システムはこの機械的推論を行わずに動作している。本稿では、矢印推しという、質量と電荷の保存則を強固にした電子流を追跡する世紀前の記号体系を通じて、言語モデルが反応機構を予測するよう教える計算枠組みを導入する。この機械的理解により、現在の方法で困難または不可能な 3 つの能力が可能となる:CASP プロposal の事後検証(物理的に妥当な電子経路の再構築)、水素原子を含むすべての原子を追跡する全体的な原子から原子へのマッピング、再生成触媒と観測者種を区別する触媒意識反応テンプレート抽出。われわれのアプローチの中心となるのは、3 つの矢印タイプを介して分子構造と電子流を符号化するコンパクトなテキスト形式である MechSMILES で、これは Python ベースの環境内に構築され、保存則を強制し、原子の幻覚(Hallucination)の可能性を消去的に設計されている。われわれは、文献内の主要な機構データセットを使用して、複雑さが異なる 4 つの機構予測タスクでモデルを訓練しベンチマーク化した。われわれの最も困難なタスク、すなわち反応物、条件、望ましい生成物のみから完全な機構を予測するタスクにおいて、FlowER および mech-USPTO-31k データセットにおいて、それぞれ 93.2% と 73.3% の経路検索を達成し、トプ3検索はそれぞれ 97.6% と 86.5% となる。さらに、この枠組みは新しい反応クラスを迅速に学習し、40 回の訓練サンプルからオゾン分解と鈴木縮合反応における強力な機械的予測が得られた。この仕事は、物理的に意味のある電子移動に基づいて予測をground することにより、より解釈可能かつ化学的に妥当な CASP ためのアーキテクチャに依存しないオープンソースの基盤を提供する。
Original Content
arXiv:2512.05722v2 Announce Type: replace
Abstract: Chemical reaction mechanisms are the foundation of how chemists evaluate reactivity and feasibility, yet current Computer-Assisted Synthesis Planning (CASP) systems operate without this mechanistic reasoning. We introduce a computational framework that teaches language models to predict reaction mechanisms through arrow-pushing formalism, a century-old notation that tracks electron flow while enforcing conservation of mass and charge. This mechanistic understanding enables three capabilities that are difficult or impossible with current methods: post-hoc validation of CASP proposals by reconstructing physically plausible electron pathways, holistic atom-to-atom mapping that tracks all atoms including hydrogens, and extraction of catalyst-aware reaction templates that distinguish recycled catalysts from spectator species. Central to our approach is MechSMILES, a compact textual format encoding molecular structure and electron flow through three arrow types, designed within a Python-based environment that enforces conservation laws and eliminates the possibility of atom hallucination. We trained and benchmarked models on four mechanism prediction tasks of increasing complexity using the main mechanistic datasets in the literature. On our most challenging task, predicting complete mechanisms given only reactants, conditions, and the desired product, our models achieve 93.2\% and 73.3\% pathway retrieval on the FlowER and mech-USPTO-31k datasets respectively, with top-3 retrieval reaching 97.6\% and 86.5\%. Furthermore, the framework rapidly learns new reaction classes, with strong mechanistic predictions for ozonolysis and Suzuki cross-coupling emerging from as few as 40 training examples each. By grounding predictions in physically meaningful electron movements, this work provides an architecture-agnostic, open-source foundation for more explainable and chemically valid CASP.