Back to list
arxiv_cs_lg 2026年4月20日

マルチ目的強化学習によるフェノタイプ・ターゲット間のギャップの架け橋: モレキュラー生成のために

Bridging the phenotype-target gap for molecular generation via multi-objective reinforcement learning

Translated: 2026/4/20 11:03:52
variational-autoencoderreinforcement-learningmolecular-generationdrug-discoverydeep-learning

Japanese Translation

arXiv:2509.21010v2 Announce Type: replace 摘要:薬理活性を持つ分子を、de novo で生成することが望ましいフェノタイプ変化を引き起こす能力において、ますます注目されています。ただし、過去の手法は主に発現プロファイルに基づいて分子生成を案内しており、分子が生きた細胞環境に及ぼす摂動効果を無視しています。この限界を克服するために、潜在変数 autoencoder (VAE) アーキテクチャに基づく新しい生成モデル、SmilesGEN を提案します。SmilesGEN は、事前学習された薬物 VAE(SmilesNet)と発現プロファイル VAE(ProfileNet)を統合し、薬物摂乱と転写応答の相互作用を共通の潜在空間で同時にモデル化します。具体的には、潜在空間で薬物引き起こされた摂乱を除去する場合に事前治療の発現プロファイルを再構築するように ProfileNet に制約をかけ、かつ目的とする発現プロファイルによって SmilesNet に情報を与えて薬理活性を持つ分子を生成します。経験実験は、SmilesGEN が現在の最先端モデルよりも、より高い有効性、独自性、革新性、および関連タンパク質を標的とする既知リガンドとの高いタニモト相似性を持つ分子を生成することを示しています。さらに、SmilesGEN をベース架台に基づく分子最適化および治験剤の生成に評価し、承認された医薬品との高い相似性を持つ分子生成において superior パフォーマンスを有することを確認しました。SmilesGEN は、望ましい細胞型変化を誘発する可能性のある drug-like molecules を生成するために遺伝子シグネチャを活用する堅固なフレームワークを確立しました。ソースコードとデータセットは、https://github.com/hliulab/SmilesGEN で利用可能です。

Original Content

arXiv:2509.21010v2 Announce Type: replace Abstract: The de novo generation of drug-like molecules capable of inducing desirable phenotypic changes is receiving increasing attention. However, previous methods predominantly rely on expression profiles to guide molecule generation, but overlook the perturbative effect of the molecules on cellular contexts. To overcome this limitation, we propose SmilesGEN, a novel generative model based on variational autoencoder (VAE) architecture to generate molecules with potential therapeutic effects. SmilesGEN integrates a pre-trained drug VAE (SmilesNet) with an expression profile VAE (ProfileNet), jointly modeling the interplay between drug perturbations and transcriptional responses in a common latent space. Specifically, ProfileNet is imposed to reconstruct pre-treatment expression profiles when eliminating drug-induced perturbations in the latent space, while SmilesNet is informed by desired expression profiles to generate drug-like molecules. Our empirical experiments demonstrate that SmilesGEN outperforms current state-of-the-art models in generating molecules with higher degree of validity, uniqueness, novelty, as well as higher Tanimoto similarity to known ligands targeting the relevant proteins. Moreover, we evaluate SmilesGEN for scaffold-based molecule optimization and generation of therapeutic agents, and confirmed its superior performance in generating molecules with higher similarity to approved drugs. SmilesGEN establishes a robust framework that leverages gene signatures to generate drug-like molecules that hold promising potential to induce desirable cellular phenotypic changes. The source code and datasets are available at: https://github.com/hliulab/SmilesGEN.