Sci. Adv. | 杭州师大团队提出双轨分子设计

MindDance

发布于 2026-06-29 14:18:06

820

做新药通常是一件很慢的事。一个候选分子从想法到上市，往往要十年、二十多亿美元。所以当人工智能号称能加速这条管线时，最该问的问题其实很朴素：在分子设计这件具体的手艺上，AI 到底强在哪、弱在哪，又该把它放在化学家旁边的什么位置。

杭州师范大学等机构的一项研究做了一个不太常见的设计来正面回答这个问题。他们没有简单地用 AI 找一个药了事，而是先用 AI 从零生成一个抑制酪氨酸酶的苗头分子，然后让两套人马从同一个起点出发、平行往下改：一边是医药化学家凭经验改，一边是 AI 继续自动生成。两条路各自产出一个化合物库，再放进同一套生物学测试里比成绩。换句话说，他们刻意把 AI 和化学家放进了一场可对照的竞赛——而比赛用的那个起跑分子，本身又是 AI 生成的。

全文研究路线一图概览——从 AI 的从头生成得到苗头分子 AI10，到专家与 AI 双轨优化，再汇入酶活、细胞、斑马鱼等生物学验证。

要看懂这场较量，得先弄清三件事：靶点为什么难、AI 这台分子生成器怎么转、以及最后为什么是化学家的分子笑到了最后。

01 靶点：一个被两枚铜原子守着的活性中心

这项研究瞄准的是色素沉着类皮肤问题——黄褐斑、老年斑、炎症后色沉。它们的共同源头是黑色素过量，而黑色素合成的总开关，就是酪氨酸酶（tyrosinase，简称 TYR）。临床上常用的曲酸、熊果苷、氢醌都是冲它来的，但普遍效力一般、稳定性差、还有副作用，所以业内一直在找更强更安全的替代品。

TYR 之所以难对付，问题出在它的活性中心。

〔难在哪〕 TYR 是一种含铜酶，活性中心是两枚铜原子组成的双核铜中心，外面由六个组氨酸残基围着固定。它干的活是把 L-酪氨酸先氧化成 L-多巴，再氧化成多巴醌，后者是黑色素的直接前体。一个想抑制它的分子，不能只是结合得牢，还得在两枚铜原子构成的特殊电子环境里站稳、把催化通路堵住。正是这种又要亲和力高、又要会跟铜中心打交道的双重要求，让大多数已知抑制剂都只能做到中等效力。

记住这个铜中心，后面看分子怎么结合时会反复用到它。

02 AI 这台分子生成器，到底在做什么

研究里 AI 负责的核心环节叫从头分子生成（de novo generation）。它的运转方式，被规整成了一个强化学习问题。

具体到这里，三个要素是这样对应的：状态是当前已经搭到一半的分子；动作是从反应模板库里挑一个反应、再挑一个砌块接上去；奖励则同时衡量这个分子的结合力、成药性和好不好合成。智能体要学的，就是一套搭分子的策略。

这套做法最值得说的地方，在于它从根上回避了老一代生成模型的通病。

〔打个比方〕 早期一些 AI 是直接在画布上自由地加原子、连化学键，画出来的分子常常很漂亮，却根本合不出来，或者要十几步反应才能做出来。这项研究换了个思路：AI 只能用一套真实的反应模板（相当于一本验证过的菜谱），从一柜真实可买的砌块（相当于现成食材）里取料，每个分子最多三步反应搭成。这样一来，凡是它造出来的，原则上就都是能下锅的。合成可行性不是事后再去补救，而是被写进了规则本身。

奖励的算法也值得拆开看一眼，因为它决定了 AI 会往哪个方向使劲。

〔具体一点〕 奖励是一个加权求和：结合力（用 AutoDock Vina 对接打分）权重 0.6，成药性（按 Lipinski 五规则）权重 0.2，合成可达性 0.2，再减去一个多样性惩罚项。多样性惩罚的意思是，如果新造的分子和已经造过的太像（用分子指纹的 Tanimoto 相似度衡量），就扣分，逼着模型别老在一个地方打转。最终奖励被限制在 −5 到 5 之间，防止训练失稳。结合力占了大头，说明绑得牢是第一位的，但成药和可合成各占两成，等于给纯追求活性的冲动套了缰绳。

工程上，他们用的是擅长连续动作空间的 Soft Actor-Critic 算法，配上蒙特卡洛树搜索来探索搭建路径，用约 1.3 万个砌块、300 个反应模板，训练了 2 万个回合。跑完后保留对接打分最好的前 200 个分子，再结合化学家的判断挑出 28 个真去合成，编号 AI1 到 AI28。

RL 从头生成的总流程——从反应模板库和砌块库出发，经虚拟合成与对接打分，把可合成性和成药性写进奖励，最后经多级筛选得到 28 个候选分子 AI1–AI28。

03 第一个赢家 AI10：有潜力，也有毒性

28 个分子合出来后，用蘑菇酪氨酸酶做了活性测试。这里有个小知识点会反复出现：

〔术语解释〕 TYR 实际干两份活，先把单酚（酪氨酸）变双酚，再把双酚（多巴）变醌。测试时用 L-酪氨酸做底物，考的是前一步（单酚酶活性）；用 L-多巴，考的是后一步（双酚酶活性）。这批分子普遍对单酚酶那一步抑制得更狠。

结果是 28 个里有 10 个显示出明显活性，而且按骨架分，含哌嗪环的那一系明显比哌啶和酰胺系更强。冒头最高的是 AI10：以 L-酪氨酸为底物时 IC50 = 5.93 ± 0.64 μM，比阳性对照曲酸（19.98 μM）强了三到四倍。化学家还从中读出一条规律——末端芳环上带对羟基苯基的分子活性更好，AI4、AI10、AI13 都把曲酸甩在身后。

28 个 AI 从头生成分子与对照药的酪氨酸酶抑制活性（L-多巴 / L-酪氨酸两种底物的 IC50），AI10 在表中活性最强。

但 AI10 有个麻烦。细胞毒性测试里，它的最大无毒浓度只有 50 μM。

〔术语解释〕 最大无毒浓度（MNC）指细胞存活率还能保持在 85% 以上的最高给药浓度。这个值越高越安全——意味着要更高的剂量才开始伤细胞。AI10 的 MNC 只有 50 μM，而曲酸和熊果苷都到 200 μM，所以 AI10 反倒更毒。

研究团队还是选了它当苗头化合物，理由很务实：酶水平活性最高、结构上同时带哌嗪环和酚羟基（给后续改造留好了下手的位置）、而且那点毒性看着像是可以靠改结构压下去的——比如把哌嗪换成哌啶。于是故事走到了那个分叉口。

04 分叉口：两条优化路线同时开跑

从 AI10 出发，两条路被刻意设计成对照。

化学家这一路（专家引导）把 AI10 拆成 A、B、C 三个区来系统改造。对接分析告诉他们，A 区正好嵌进 TYR 的活性口袋、对结合力起决定作用，于是改造火力集中在这里：换上各种给电子、吸电子的芳环和杂芳环，做吡啶、嘧啶之类的生物电子等排，调连接子。同时针对第一轮暴露出的溶解度问题，刻意往里加亲水基团、减少芳环数目。三个子系列加起来设计了 57 个衍生物（AI10-m1 到 AI10-m57）。

基于经典药物化学策略对 AI10 的 A/B/C 区系统改造——三个系列的衍生物，以及作为关键药效团引入的间苯二酚-乙烯基结构。

AI 这一路（RL 驱动）则把 AI10 当参照骨架，用 BRICS 算法把它拆成查询片段，再到 ZINC 库里找相似砌块重新长出新分子，这一轮换用了 TD3 算法，规则比第一轮更松（分子量上限放到 500、仍限三步以内）。它生成、自己用对接反馈打分，配合专家把关，最后挑出 32 个候选（AI10-a1 到 AI10-a32）。

值得留意的是，所谓 AI 这一路并不是全自动的：它生成的结构经过了专家评估和筛选，第一轮的 28 个也是结合化学家判断挑出来的。后面回看胜负时，这一点很重要。

05 成绩单：纳摩尔级的飞跃，和两条路不同的形状

把两个库丢进同一套酶活测试，差异立刻显出来。

化学家那 57 个里，多数活性优于苗头分子，34 个比 AI10 和对照药都强。最关键的一跳来自 A 区引入了一个间苯二酚-乙烯基结构——这一改让活性直接冲进纳摩尔级。其中：

• AI10-m15：L-多巴 IC50 = 0.019 μM，L-酪氨酸 IC50 = 0.020 μM（约 20 纳摩尔）；
• AI10-m52：L-多巴 IC50 = 0.0063 μM，L-酪氨酸 IC50 = 0.0057 μM（约 6 纳摩尔）。

相对约 10–17 μM 的母体，这是大致三个数量级的提升。需要说清的一点是：单看酶水平，AI10-m52 才是最强的抑制剂（约 6 纳摩尔），比 AI10-m15 还低一截。摘要里把 m15 称作最强抑制剂，更像是着眼于它后面的综合表现，而非酶活的绝对数字——按 Table 2 的硬数据，最强酶抑制者是 m52。这个区别后面会变得很有意思。

AI 那 32 个里，多数强过曲酸，15 个强过 AI10，最好的 AI10-a2 做到 L-酪氨酸 IC50 = 0.68 μM、L-多巴 0.92 μM，相对 AI10 约 20 倍的进步。这是个亚微摩尔、几百纳摩尔量级的水平，扎实，但和化学家手里那两个纳摩尔级的分子不在一个段位。

两条优化路线所得化合物与对照药的酪氨酸酶抑制活性（IC50）全表，可直接对比 AI10-m15、AI10-m52、AI10-a2 的数值。

把两组分子的活性分布画成小提琴图，两条路的不同形状就一目了然：化学家这组大多数落在 10 μM 以下，中位活性明显更高、更集中；AI 这组只有 6 个进到 10 μM 以下、仅 2 个进到 5 μM 以下，分布更宽、不确定性更大，还有 11 个因为溶解度太差根本测不出来。研究者的总结很克制：专家改造给的是稳定、可预期的提升；AI 生成更敢探索、偶尔能蹦出高活性分子，但代价是更高比例的无效候选。这其实就是生成模型的两面——能闯进人想不到的化学空间，也得承担可靠性上的折扣。

对接模拟给这些活性差异配了一套力学解释（用 Discovery Studio 做的，并先拿两个低活性分子验证了对接确实给它们打了低分）。AI10 只跟一枚铜离子作用、和 Glu322 形成一个氢键；而几个赢家的结合网络明显更密——AI10-m52 同时抓住了两枚铜原子，AI10-m15 则和 Asn81、His85 拉了两个氢键。更复杂的相互作用网络，对应更强的抑制，这条逻辑链是自洽的。

修饰化合物的活性分布（小提琴图）、构效关系小结，以及 AI4、AI10、AI10-a2、AI10-m15、AI10-m52 等与 TYR（PDB: 2Y9X）的结合模式。

06 但酶活不等于药：穿过一道道下游关卡

如果故事停在酶活，结论会简单得多。真正有意思的是，分子离开试管、走进细胞和动物之后，排名被重新洗了一遍。

先是安全性。把哌嗪换成哌啶这一招果然管用——这正是当初选 AI10 时埋下的伏笔。改造后 AI10-m15、AI10-m52、AI10-a2 等几个分子的 MNC 翻到 100 μM，是 AI10 的两倍，治疗窗口一下被拉开。对 AI10-m15 来说，酶活在 20 纳摩尔、毒性要到 100 微摩尔才出现，这中间是数千倍量级的安全余地。

四种细胞（A375、B16F10、HEM、HaCaT）上的细胞毒性与活性的多参数综合评估，可看出哪些分子同时实现了更安全和更强。

接着是更接近真实使用场景的考验。这类分子是要往皮肤上用的，所以皮肤透过性很关键。用预测模型看皮肤渗透系数 log Kp（−3 到 −1 之间算理想），AI10 是 −3.371，偏亲水、透不太进去；几个优化分子都改善了。再往后到细胞里抑制黑色素生成，AI10-m15 表现最好，强过曲酸和熊果苷；m52 与熊果苷相当；a2 最弱，和曲酸差不多。注意，最强酶抑制者 m52，在细胞这一关已经被 m15 反超了。

到了斑马鱼这一步，反差更明显。

〔关键洞察〕 在斑马鱼胚胎里看头部黑色素，AI10-m15 让色素显著变浅，60 μM 时去色素效率 20.93%，体内活性最强；AI10-a2 也有效但弱些（12.68%）；而酶水平最强的 AI10-m52，体内几乎看不出抗黑色素活性。AI10 本身则因为太毒，直接被排除在统计之外。一个在分离酶上绑得最牢的分子，到了活体里却几乎不灵——这是整篇研究里最该停下来体会的一笔：酶上的 IC50 只是众多坐标里的一个，能不能穿透组织、在活体里真正堵住色素合成，是另一道完全独立的题。最强结合者和最好的药，往往不是同一个分子。

最后给 AI10-m15 补了代谢稳定性。在人肝微粒体里半衰期 123.95 分钟，优于参照药维拉帕米，45 分钟后还剩约 79.89% 原型；在人血浆里半衰期约 271 分钟，而作为对照的普鲁卡因（一个酯类，极易被酯酶切断）半衰期不到 5 分钟——说明 m15 扛得住血浆里的水解酶，避开了一条常见的代谢失活通路。一套体外药代下来，它看上去确实像个能往下走的候选。

活性分子与阳性对照的抗黑色素评估——B16F10 细胞里的剂量依赖抑制、斑马鱼胚胎去色素、以及 AI10-m15 在肝微粒体和血浆中的代谢曲线。

07 谁赢了？竞争，还是分工

研究把标题起成 AI 与化学家的竞争，但数据给出的答案其实更接近分工。

〔一点判断〕 这场较量里，真正被推上候选席的 AI10-m15，是化学家改出来的；AI 那一路最好的 a2，在细胞、斑马鱼、几乎每一条下游坐标上都更弱。而压制活性那一跳，靠的是 A 区引入的间苯二酚-乙烯基——间苯二酚类本就是化妆品里有长期记录的酪氨酸酶抑制母核，化学家是从文献记忆里直接调出这一招的。一个只拿对接打分当奖励的生成模型，恰恰最缺这种领域先验。但反过来说，整条链的起点 AI10 是 AI 生成的，AI 也确实造出了人未必会去尝试的非常规骨架。再加上 AI 那一路并非全自动、每道闸口都有人在筛——所以把它当成一场干净的人机对决，本身就有点理想化。比较公允的读法是：AI 把漏斗口拓宽、并播下了起点，化学家的构效知识把潜力转化成了可开发的候选。竞争是个好用的叙事框，数据讲的是互补。

这也正是作者最后落到的立场——把 AI 当探索引擎，把化学家当那个保证化学合理性和可开发性的决策核心，两者是协作而非替代。

08 几条边界，得放在心里

这是一项设计巧妙、把分子真做出来、还跑通了体内验证的工作，但有几处需要清醒看待。

〔边界〕 一是替身问题。酶活测的是蘑菇酪氨酸酶，对接用的是一个 TYR 晶体结构（2Y9X），两者都是人源酶的筛选替身——这在该领域是惯例，但在替身上的纳摩尔活性，未必能原样搬到人的色素系统上。

二是打分的性质。作者自己也强调，对接只是结合力的粗略估计，AutoDock Vina 简化了能量学、没把溶剂、熵、蛋白柔性算全，所以对接分应当看作启发式信号，而非精确的热力学预测。

三是预测与实测之分。皮肤透过性、亲脂性这些来自 pkCSM、SwissADME 的预测，不是实测数据。

四是泛化未验。整套框架只在 TYR 这一个靶、一类骨架上试过，能不能迁移到别的靶点，还需要后续验证。

五是那个反差本身就是提醒：酶上最强的 m52 在体内几乎不灵，足以让人对把 IC50 直接当药效读保持警惕。

顺带一提，原文在两个优化分子相对母体的倍数提升上，与表中 IC50 的绝对数值存在不一致之处，本文因此只采用可直接核对的 IC50 数据来描述提升幅度，未沿用那组互相矛盾的倍数说法。

09 余味

这项研究最安静、也最值钱的一笔，或许不是谁赢了那场比赛，而是从试管到斑马鱼之间发生的那次重新排序。生成模型能在几万回合里把可合成的分子源源不断造出来，这在几年前还很难想象；但分子被造出来之后那一长串关卡——细胞、透皮、活体、代谢——才是大部分真相所在。最会绑酶的分子和最好的药，终究是两个问题。AI 把第一个问题的答题速度提了上去，第二个问题，目前还得交给那些记得间苯二酚该用在哪儿的人。

参考文献

Sun Y, Wang J, Chen W, et al. Discovery of TYR inhibitors from de novo molecular generation to dual-track lead optimization: "Competition" between AI and chemists. Science Advances, 2026, 12(25): eaeg0376. DOI: 10.1126/sciadv.aeg0376。

AI 模型源码已公开（GitHub: jubin75/RL-syn-Tyr；Zenodo 存档）