Back to list
OXtal: オルガニック結晶構造予測のための全原子拡散モデル
OXtal: An All-Atom Diffusion Model for Organic Crystal Structure Prediction
Translated: 2026/4/20 11:04:51
Japanese Translation
arXiv:2512.06987v2 発表タイプ:置換
本文:実験的に実現可能な 3 次元分子結晶構造を 2 次元化学構造から正確に予測することは、結晶構造予測 (Crystal Structure Prediction, CSP) と呼ばれる計算化学の長年の未解決課題です。この問題の効率的な解決は、医薬品から有機半導体まで、有機固体の物性と化学的性質を直接的に支配する結晶のパッキング構造にわたる影響を及ぼします。本稿では、分子内構造と周期パッキング上の条件付きjoint分布を直接学習する、1 億パラメータ規模の全原子拡散モデル「OXtal」を紹介しました。OXtal のスケーラビリティを最大化するために、結晶対称性から生じる誘導バイアスを課す明示的な対称性保持アーキテクチャを放棄し、データ拡張戦略を採用しました。また、明らかな格子パラメータ化を避けて長距離相互作用を効率的に捉えるため、新しい「Stoichiometric Stochastic Shell Sampling ($S^4$)」という結晶化に着想を得た格子なしトレーニングスキームを提案しました。これにより、全原子分解能においてよりスケーラブルなアーキテクチャ選択が可能となりました。60 万点を含む実験的に検証された結晶構造の大きなデータセット(刚性および柔軟な分子、共結晶、溶媒和を含む)を活用した OXtal は、従来の ab initio マシンラーニング CSP 手法と比較して桁落ちの改善を実現し、従来の量子化学的方法よりも桁落ちのコストで済みました。具体的には、OXtal は conformer $ ext{RMSD}_1 < 0.5$ Åの経験構造を回復し、80% 以上のパッキング類似率を達成しました。これは、分子結晶化の熱力学的および力学的規則をモデル化する能力を示しています。
Original Content
arXiv:2512.06987v2 Announce Type: replace
Abstract: Accurately predicting experimentally realizable 3D molecular crystal structures from their 2D chemical graphs is a long-standing open challenge in computational chemistry called crystal structure prediction (CSP). Efficiently solving this problem has implications ranging from pharmaceuticals to organic semiconductors, as crystal packing directly governs the physical and chemical properties of organic solids. In this paper, we introduce OXtal, a large-scale 100M parameter all-atom diffusion model that directly learns the conditional joint distribution over intramolecular conformations and periodic packing. To efficiently scale OXtal, we abandon explicit equivariant architectures imposing inductive bias arising from crystal symmetries in favor of data augmentation strategies. We further propose a novel crystallization-inspired lattice-free training scheme, Stoichiometric Stochastic Shell Sampling ($S^4$), that efficiently captures long-range interactions while sidestepping explicit lattice parametrization -- thus enabling more scalable architectural choices at all-atom resolution. By leveraging a large dataset of 600K experimentally validated crystal structures (including rigid and flexible molecules, co-crystals, and solvates), OXtal achieves orders-of-magnitude improvements over prior ab initio machine learning CSP methods, while remaining orders of magnitude cheaper than traditional quantum-chemical approaches. Specifically, OXtal recovers experimental structures with conformer $\text{RMSD}_1<0.5$ {\AA} and attains over 80\% packing similarity rate, demonstrating its ability to model both thermodynamic and kinetic regularities of molecular crystallization.