

文献来源: Keserű GM, Erlanson DA, Ferenczy GG, Hann MM, Murray CW, Pickett SD. Design Principles for Fragment Libraries: Maximizing the Value of Learnings from Pharma Fragment-Based Drug Discovery (FBDD) Programs for Use in Academia.J. Med. Chem. 2016, 59, 8189–8206. 作者机构: 匈牙利科学院自然科学研究中心、Carmot Therapeutics(美国)、GlaxoSmithKline(英国)、Astex Pharmaceuticals(英国)

本文是一篇由来自多家顶级制药企业的科学家联合撰写的综述,旨在将工业界在片段药物发现(Fragment-Based Drug Discovery, FBDD)领域积累的系统性经验输出给学术界。作者们坦率地指出:FBDD在工业界已高度成熟,但在学术界往往执行不够规范,缺乏对最新设计原则的掌握,这正是本文写作的核心动机。
文章覆盖面极广,涵盖筛选技术选择与比较、片段库理化性质设计、分子复杂度理论、大小与形状考量、靶标相关策略、合成可优化性,以及库的物理管理等方方面面。
FBDD的根本优势来自组合数学的基本原理。一个包含 500,000 个化合物的高通量筛选(HTS)库,其化学空间覆盖率远不及一个仅含 数千个 精心选择片段的FBDD库。这是因为:
这意味着:几乎可以确信,片段库中存在能与任何蛋白质口袋发生有效相互作用的分子。
片段通常对靶蛋白的亲和力极弱(Kd在100 μM至10 mM范围),这在传统HTS思维中是"失败"——但在FBDD中,这恰恰是设计特性而非缺陷:
维度 | HTS | FBDD |
|---|---|---|
化合物数量 | 10⁵–10⁶ | 500–3000 |
分子量范围 | ~400–500 Da | ~140–230 Da |
典型亲和力 | <10 μM | 100 μM – 10 mM |
命中检测方法 | 生化活性为主 | 生物物理方法为主 |
化学空间覆盖 | 窄 | 宽 |
先导物质量 | 参差不齐 | 通常LE更高 |
优化路径 | 基于活性SAR | 基于结构的SBDD |
2003年,Congreve等人从有限的片段筛选数据中归纳出著名的"三规则"(Rule of Three, RO3):
分子量 ≤ 300 Da,氢键供体数 ≤ 3,氢键受体数 ≤ 3,cLogP ≤ 3
然而,文章作者们明确指出:RO3是起点,而绝非全部。十余年实践表明,成功的片段库设计需要在以下多个维度上综合考量。
HTS常用的生化活性检测通常只能检测 Kd < 10 μM 的结合,而片段的典型亲和力比这弱100–1000倍。因此FBDD必须依赖更灵敏的生物物理学技术。

技术 | 灵敏度下限 | 特异性评估 | 通量 | 结构信息 | 假阳性/假阴性倾向 |
|---|---|---|---|---|---|
表面等离子共振(SPR) | 高 μM | ✓ | 中 | 无 | 中假阳性 |
配体观测NMR(STD-NMR等) | 低 mM | ✗ | 中 | 少 | 中假阳性 |
蛋白观测NMR | 低 mM | ✓ | 低 | 高 | 低假阳/假阴 |
X射线晶体学 | 中 mM | ✓ | 低 | 极高 | 低假阳/高假阴 |
热位移(TSA/DSF) | 高μM–低mM | ✗ | 高 | 无 | 高假阳/假阴 |
生化活性检测 | 高 μM | ✓ | 高 | 无 | 高假阳/假阴 |
SPR 能检测结合动力学,但芯片表面的非特异性结合是主要假阳性来源;配体构型变化也可能影响信号。
配体NMR(STD-NMR, WaterLOGSY) 对弱结合非常灵敏,适合混合物(cocktail)筛选,但无法区分特异性与非特异性结合,需正交验证。
蛋白NMR 是特异性最高的技术之一,可直接定位结合位点,但对蛋白用量要求高(需同位素标记),通量低。
X射线晶体学 提供原子分辨率的结合模式,假阳性极低,但假阴性率高(需要化合物有足够的晶体占有率)。随着自动化晶体学平台的发展(如CSIRO的协作结晶中心),其通量正在显著提升。
热位移(TSA) 操作简便、通量高,但对化合物降低Tm的情况难以解读,特异性较差。
生化活性检测 在排除聚集干扰、设置正确浓度的前提下可用于FBDD,但需更严格的后续验证。
文章通过六个具体案例(HIV整合酶、Checkpoint激酶2、p38α激酶、MMP12/胰蛋白酶、HSP90、内囊蛋白酶)揭示了一个核心结论:
不同技术筛选出的苗头化合物重叠度极低。
典型数据:
实践结论:
筛选技术的选择反向决定了片段库的物化性质要求(图3所示循环关系):
assay sensitivity & specificity
↓
assay concentration requirement
↓
solubility requirement
↓
MW & logP constraints
↓
accessible affinity range例如:NMR和X射线晶体学通常在 mM 级浓度下筛选,因此对溶解度要求极高;而SPR在100 μM–500 μM级别操作,相对宽松。
Hann等人于2001年提出的分子复杂度模型是FBDD的理论基石之一。该模型用两条概率曲线描述片段结合行为:
关键推论:
从信息论视角,不同类型的分子相互作用具有不同的"信息内容":
这一分析解释了为何:
文章推荐在FBDD不同阶段使用不同的效率指标:
配体效率(LE):
可接受下限:LE ≥ 0.3(对良好结合位点而言)。
亲脂性配体效率(LLE / LipE):
优先选择LLE高的苗头物,避免亲脂性驱动的虚假活性。
重原子校正的亲脂配体效率(LLEAT):
兼顾大小、亲脂性与活性,与LE量纲一致,推荐在先导物优化阶段使用。
基团效率(Group Efficiency, GE):
评估每个优化步骤新加原子的"效率",避免盲目增加分子量。
实践警示: 这些指标是指导性工具而非绝对法则。文章明确提醒:指标应作为过滤和优先级排序的辅助手段,不应僵化地作为go/no-go决策依据。
文章梳理了关于片段最小有效尺寸的大量实验证据,形成如下共识:
片段优化的核心假设是:随着片段"生长",初始结合模式得以保持。但实验证据表明,这一假设并不总是成立:
支持保守性的证据:
挑战保守性的证据:
Kozakov热点理论的实践意义:
主流做法的局限: 传统片段库以含平面芳香环(如嘧啶、吡啶)的化合物为主,库的三维形状多样性严重不足。
增加3D性的潜在收益:
增加3D性的实际代价:
文章的平衡建议: FBDD的最大化利用取决于复杂度、尺寸与多样性之间的精细平衡,应根据靶标特性和筛选技术灵活调整3D片段的比例,而非一概而论。
文章区分了两个常被混淆的概念:
FBDD最有价值的用途之一,正是在靶标验证早期评估可配体性——片段筛选的命中率与HTS命中率及最终先导物优化成功率均具有良好相关性。
酶类靶标(最有利):
蛋白-蛋白相互作用(PPI)靶标(挑战最大):
变构位点(被低估的机会):
膜蛋白靶标:
目标导向库的优势: 命中率高,化学优化路径清晰(如激酶ATP竞争性片段库的成功)。
目标导向库的风险: 新颖性不足,可能错过最有价值的意外发现(serendipity)。典型反例:PAK1筛选发现的变构片段与腺嘌呤几乎无结构相似性,却产生了高度选择性抑制剂。
文章结论: 两种策略各有其用,关键是目的。若时间紧迫、靶标明确,用导向库;若探索新靶标或新机制,用多样性通用库。
一个理想的FBDD片段不仅要能"命中"靶蛋白,更要"长得出来"——即具备充足的合成生长向量(synthetic handle),能通过2–4步合成扩展为先导物。
文章介绍了多种系统化确保可优化性的策略:
反应字典法(Reaction Dictionary): Novartis团队建立了反应词典,专门筛选那些关键活性基团被"遮蔽"(masked)、可通过简单去保护/转化暴露合成把手的片段。
Poised Fragment Library(预置片段库): Cox等人设计的片段库中,所有片段均直接来自简单合成反应,使类似物的快速制备成为可能;此方法已成功用于PHIP(2)溴结构域的首个抑制剂发现。
RECAP方法: 将片段拆解为可扩展的"核心"结构,通过子结构搜索评估已有取代位点的数量,从而在筛选前完成优化潜力排序。
可优化性的计算评估(In Silico Assessment): 基于内部及外部数据库的子结构搜索,对候选片段的优化可行性进行虚拟排序,适用于处理大量潜在片段。
3D片段(多样性导向合成,DOS):
天然产物来源片段:
共价片段库(Covalent Fragment Library):
这部分内容在综述中较为罕见,但作者专设章节介绍,足见其实际重要性。
纯度要求: 每个片段须达到90–95%以上纯度。最低标准为HPLC-MS确认,推荐同时使用NMR,尤其在NMR为筛选技术时(可将入库纯度确认与筛选前处理合并)。
商业来源的警示: 针对超过10家供应商的>10,000个样品调查显示,16%的样品未通过QC,部分供应商失败率高达33%。因此,即使采购商业片段库,也必须进行in-house重新确认。
备用干储(Dry Stock)的重要性: 需为后续确认实验保留足量固体原料。Pfizer标准要求每个自有化合物储备至少200 mg。商业来源片段须在采购时确认长期供货能力,否则可能出现苗头物确认时货源已断的困境。
DMSO(绝大多数情况下的首选):
甲醇(晶体学特定用途):
DMSO溶液的降解风险(基于Procter & Gamble对7200个化合物的研究):
储存时间 | 室温降解率 |
|---|---|
3个月 | ~8% |
6个月 | ~17% |
12个月 | ~48% |
冻融循环的隐患: 反复冻融会引入大气水分(DMSO极易吸湿),导致片段溶解度急剧下降,甚至发生沉淀。实验表明,经历反复冻融的样品比持续冷冻或室温保存的样品浓度更低。
推荐策略:
化合物本身的稳定性风险:
以下参数是本文最具实操价值的核心产出(基于表6,结合全文内容整合):
参数 | 推荐范围 | 注释 |
|---|---|---|
分子量(MW) | ~140–230 Da | 低通量高灵敏度方法(如X射线)用小分子端,高通量方法(如SPR)用大分子端 |
重原子数(HAC) | 9–16 | 最优命中率区间;<9可能结合模式过于多变 |
cLogP | 0.0–2.0 | 避免亲脂性驱动的非特异结合 |
氢键供体(HBD) | ≤3 | |
氢键受体(HBA) | ≤3 | |
可旋转键 | 0–3 | 减少熵罚,利于结合模式固定 |
手性中心数量 | 0–1(最多2) | 始终以外消旋体筛选;光学纯体留待优化阶段 |
水溶性 | ≥5 mM(5% DMSO) | 以实测为准,计算值不可靠 |
溶液稳定性 | >24小时 | 在筛选条件下实测 |
参数 | 推荐范围 | 注释 |
|---|---|---|
库大小 | 500–3000个片段 | X射线/NMR等低通量方法用500–1000;SPR/生化法可用至3000+ |
多样性指标 | 基于距离的多样性算法 | 注意:算法不应系统性偏向大片段;需确保小片段的代表性 |
每种骨架类型的变体数 | ≥3–5个 | 便于发现初步SAR,并识别结构崩溃点 |
要求 | 标准 |
|---|---|
合成步数 | 从商业可购起始原料出发,≤4步 |
生长向量数 | 每个片段至少具备多个可扩展位置(三维方向) |
类似物可得性 | 优先选择商业上有已知类似物的骨架 |
特殊考量 | 针对筛选技术设计:如含¹⁹F原子辅助NMR检测,含溴原子辅助X射线晶体学相位求解 |
类型 | 示例 | 排除理由 |
|---|---|---|
PAINS | 醌类、米迦勒受体、氧化还原循环化合物(如毒黄素) | 与蛋白质共价反应或干扰检测信号,在多种assay中均呈"活性" |
聚集体形成化合物 | 部分两亲性化合物 | 在高浓度筛选下形成胶束,产生假阳性 |
高活性官能团 | 醛、活泼酯、迈克尔受体、表氧化物等 | 非特异性共价修饰蛋白质 |
PrATs(泛活性2-氨基噻唑) | 2-氨基噻唑类 | 在广谱assay中频繁命中;注意:此类骨架并非绝对不可用,已有上市药物含此结构,需结合具体情况判断 |
药物 | 靶标 | 适应症 | 关键FBDD机构 |
|---|---|---|---|
Vemurafenib | B-RAF V600E | 黑色素瘤 | Plexxikon/Roche |
Venetoclax | BCL-2 | 慢性淋巴细胞白血病 | AbbVie/Genentech(片段起点) |
截至2016年,已有30余个FBDD来源的化合物进入临床试验。
BCL-xL/BCL-2(PPI靶标): AbbVie(原雅培)SAR by NMR技术的里程碑,从BCL-xL的片段苗头物出发,历经多轮优化,最终得到Navitoclax,进一步选择性优化为BCL-2选择性抑制剂Venetoclax(FDA 2016年批准)。
Ras("不可成药"靶标): Genentech与Vanderbilt大学分别通过NMR筛选独立发现了能结合Ras表面口袋、阻断SOS交换因子结合的片段,为K-Ras靶向药物的早期探索提供了起点。
cIAP1/XIAP(弱结合PPI): Astex在10 mM浓度下NMR筛选发现极弱苗头物,以结构指导化学优化,最终获得双靶标纳摩尔级活性抑制剂。
HCV NS3(变构机制): Astex通过片段筛选发现结合于蛋白酶-解旋酶结构域间界面的片段,揭示了全新变构调控机制,优化至低纳摩尔效力并具备细胞活性。
K-Ras G12C(共价结合): UCSF Wells课题组利用Tethering技术针对含活化半胱氨酸的K-Ras突变体,验证了共价片段策略在"不可成药"靶标上的可行性(为后续Sotorasib的发现奠定基础)。
文章最后,作者们针对学术背景的研究者给出了几点特别提示:
本文的核心贡献在于:将片段库设计从经验性操作提升为有理论基础、有实验验证、有具体参数的系统性方法论。
无论是分子复杂度的概率框架、正交筛选技术的统计支撑、结合模式保守性的结构证据,还是片段库日常管理的操作细节,都体现了作者们深厚的工业经验和严谨的科学思维。
对于希望在学术环境中系统开展FBDD的研究者而言,这篇综述不仅是技术指南,更是一份来自一线实践者的诚意之作。