
DRUGONE
在结构基础药物设计中,针对柔性蛋白口袋进行分子设计一直是一个极具挑战性的问题,因为蛋白在配体结合过程中往往会发生构象变化。尽管近年来基于深度学习的分子生成方法取得了显著进展,但多数方法仍将蛋白口袋视为刚性结构,从而无法准确刻画蛋白–配体相互作用的动态特性。
研究人员提出了一种名为 YuelDesign 的扩散模型框架,通过联合建模蛋白口袋结构与配体构象,实现真正意义上的柔性口袋分子设计。该方法基于E3等变Transformer(E3former),结合连续坐标扩散(EDM)与离散原子类型扩散(D3PM),在生成过程中同时优化几何结构与化学组成。实验结果表明,该方法生成的分子具有良好的药物相似性、较低的合成复杂度、丰富的化学多样性,并且在对接评分上可与天然配体相媲美。该框架为柔性蛋白口袋的药物设计提供了一种具有广泛应用潜力的新路径。

分子设计的核心目标是生成满足特定性质的三维结构。近年来,生成式人工智能(尤其是自回归模型与扩散模型)极大推动了这一领域的发展。现有方法大致分为两类:一类关注二维结构(如SMILES或分子图),另一类则直接生成三维构象。
在三维分子生成领域,扩散模型已经成为主流技术路线,例如DiffSBDD、PMDM等方法能够在蛋白口袋中生成候选分子。然而,这些方法存在一个关键局限:普遍将蛋白口袋视为刚性结构。
实际上,蛋白–配体结合往往遵循“诱导契合”(induced fit)机制,即配体进入口袋后会诱导蛋白侧链发生调整,从而优化相互作用。这种动态性不仅影响结合模式,还会影响结合亲和力预测、虚拟筛选乃至靶点识别。然而,当前大多数生成模型并未显式建模这一过程。
为解决这一问题,研究人员提出YuelDesign,其核心思想是:在生成分子的同时,让蛋白口袋也“动起来”。
方法概述
该框架的核心创新在于联合生成蛋白口袋与配体结构。整个流程从提取蛋白口袋开始,通过多步加噪与去噪过程,逐步生成完整的三维复合物结构。
在模型架构上,研究人员设计了E3former作为核心网络。该结构继承了AlphaFold中Evoformer的思想,但直接输出三维坐标,并保证旋转与平移等变性,使其能够处理高达数百原子的复杂系统。
在生成机制上,模型采用双扩散策略:一方面使用EDM处理连续的空间坐标,另一方面使用D3PM处理离散的原子类型。这种设计使模型能够同时学习几何结构与化学组成之间的耦合关系。

图1:YuelDesign整体流程。
结果
分子化学性质分析
研究人员从多个角度评估生成分子的性质,包括连接性、大环比例、QED、Lipinski规则、SAS以及有效性等指标。
结果表明,YuelDesign在连接性方面表现稳定,即使在分子尺寸增加时仍能保持结构完整。而在大环结构生成方面,该方法显著优于对比模型,能够有效避免过多大环结构的产生,这对于药物可合成性至关重要。
在药物相似性方面,随着分子尺寸增加,所有方法的QED均呈下降趋势,但YuelDesign始终保持更高水平。同时,在Lipinski规则满足率上,该方法在小分子区间具有明显优势。
在合成可及性方面,各方法表现相近,但YuelDesign能够在保证低复杂度的同时提升药物性质。此外,所有方法均能维持较高的化学有效性。
值得注意的是,YuelDesign能够在生成高质量分子的同时诱导蛋白口袋发生合理构象变化,这一点在图2B中得到了直观展示。

图2:分子性质评估。
分子多样性分析
研究人员进一步分析了生成分子的化学多样性,重点关注功能基团分布。
结果显示,生成分子在整体分布上与天然配体高度一致,例如醇基与胺基均为高频结构。这说明模型能够学习真实化学空间的统计规律。
但也观察到一个典型问题:小环结构(如三元环、环氧等)在生成分子中略有富集。这反映了扩散模型的一个内在缺陷——在从随机噪声生成结构时,小环由于不违反基本几何约束,更容易被生成。

图3:功能基团分布。
蛋白口袋与相互作用分析
由于YuelDesign能够同时生成蛋白结构,研究人员评估了生成口袋的结构合理性。结果显示,其与真实结构的RMSD中位数约为1.8 Å,表明模型能够生成具有生物学意义的构象。
在具体案例中,生成结构不仅保留了关键的π-π相互作用,还形成了新的极性接触。
在结合能力方面,通过AutoDock Vina和MedusaDock评分评估,YuelDesign生成的分子普遍优于对比方法。同时,再对接实验表明其结合构象更加准确。
在结构相似性方面,所有方法生成分子与原始配体的相似性均较低,说明模型能够探索新的化学空间。

图4:口袋结构与对接性能。
柔性蛋白口袋的重要性
研究人员选取CDK2作为典型案例,分析柔性建模的重要性。
在未结合状态下,CDK2中K33与D145之间存在盐桥;而在配体结合后,该盐桥被打破,D145参与与配体的相互作用。这一变化是典型的诱导契合现象。
结果显示,YuelDesign生成的分子能够有效接近D145,并诱导盐桥断裂,从而形成类似天然复合物的结合模式。而刚性模型则无法实现这一过程。
进一步分析表明,YuelDesign能够生成多种K33–D145距离分布,涵盖真实结合状态,说明其成功捕捉了蛋白口袋的动态特性。
这一结果清晰表明:蛋白口袋的柔性不是细节,而是决定分子设计成败的关键因素。

图5:CDK2案例分析。
去噪过程中的结构演化
研究人员对扩散过程进行了细致分析,揭示了分子生成的动态机制。
在原子类型层面,大多数原子在后期才稳定下来,说明化学组成的确定主要发生在扩散后期。
在结构层面,RMSD随步骤稳定下降,表明空间结构逐步收敛。键的形成主要发生在中期,而在后期趋于稳定。
整体来看,生成过程呈现出明显的阶段性:早期为随机结构,中期形成骨架,后期精细优化。

图6:扩散去噪过程分析。
讨论
YuelDesign展示了扩散模型在分子设计中的巨大潜力。其优势主要体现在以下几个方面:
首先,该方法能够生成化学合理且结构稳定的分子,同时保持与已知配体相似的功能基团分布。
其次,通过显式建模蛋白柔性,模型能够更真实地模拟蛋白–配体相互作用,从而显著提升设计质量。
此外,E3former架构通过结合序列、对偶关系与几何信息,实现了对复杂分子体系的统一建模。而双扩散机制则有效处理了连续与离散变量的协同生成问题。
然而,该方法仍存在一定局限。例如,生成分子与天然配体的相似性仍然有限;小环结构存在过度生成现象;随着分子尺寸增大,模型性能下降。
未来的改进方向包括引入潜空间扩散以降低维度,以及进一步解耦结构与原子类型生成过程,以提升生成效率与质量。
整理 | DrugOne团队
参考资料
Jian Wang et al. ,A diffusion-based framework for designing molecules in flexible protein pockets.Sci. Adv.12,eaeb7045(2026).
DOI:10.1126/sciadv.aeb7045

内容为【DrugOne】公众号原创|转载请注明来源