
DRUGONE
近年来,生成式人工智能在蛋白质设计领域取得巨大突破,但在DNA origami(DNA折纸)结构设计中的应用仍然非常有限。其中最大的障碍在于缺乏大规模、标准化且包含真实结构信息的数据集,导致难以训练高质量的生成模型。
在这项研究中,研究人员提出了一种基于扩散模型(diffusion model)的DNA折纸生成设计框架——Generative SNUPI。该方法利用多尺度物理模拟获得大量DNA折纸平衡构象,并以此构建训练数据集。用户只需输入目标几何轮廓,模型即可通过扩散采样与DNA链路由自动生成物理可实现的DNA origami结构,同时结合结构预测模块对稳定性与力学性质进行定量评估。研究人员生成并测试了超过100种DNA origami结构,其中部分设计经过实验验证后,成功实现正确折叠,并表现出负泊松比变形、模块化组装等复杂功能。研究结果表明,生成式AI有望显著扩展DNA origami的可设计空间,为复杂、可重构纳米结构的开发提供全新思路。

DNA origami是一种利用DNA碱基互补配对构建纳米尺度结构的技术。通过精确控制DNA双链之间的杂交关系,研究人员能够制造具有特定几何形状和功能特性的纳米结构。过去十余年中,DNA origami已经被广泛应用于分子机器人、纳米器件、生物医学工程以及动态纳米系统等领域。
传统DNA origami设计通常依赖规则晶格结构与固定交叉点布局。这类方法虽然稳定可靠,但在生成复杂自由曲线、动态变形结构以及高度非规则几何体时存在明显限制。很多复杂结构仍需要专家手动干预与大量经验调整。
与此同时,扩散模型等生成式AI技术已经在蛋白质设计和小分子生成领域展现出极强能力。例如RFdiffusion等模型能够直接从随机噪声生成全新的蛋白结构。然而,DNA纳米结构领域的发展却相对滞后,其核心问题在于缺乏足够大的训练数据集。
相比蛋白质,DNA origami结构的实验解析数量极少,而且结构表示方式不统一,难以直接用于深度学习训练。因此,研究人员提出一个关键思路:通过物理模拟大规模生成DNA origami平衡构象,从而建立标准化训练数据集,并利用扩散模型学习DNA纳米结构的几何先验。
方法
研究人员开发了一个名为Generative SNUPI的生成式DNA origami设计框架。该系统基于DDPM(Denoising Diffusion Probabilistic Model)扩散模型,在碱基层面学习DNA origami的三维结构分布。
训练数据来源于450个DNA wireframe origami结构,这些结构通过SNUPI多尺度模拟系统获得其平衡态构象。每个碱基对均以三维坐标形式表示,模型将整个DNA结构视为点云进行学习。
训练过程中,研究人员向结构逐步添加高斯噪声,再训练模型学习如何从噪声中恢复真实DNA结构。为了保证空间几何一致性,模型引入SE(3)-equivariant Transformer结构,使其能够天然适应三维旋转与平移不变性。
在生成阶段,用户可以输入目标线条几何图形,例如手绘草图、CAD设计图甚至AI生成图案。扩散模型随后通过条件采样逐步生成符合目标形状的DNA结构,并结合自动DNA链路由算法生成scaffold路径与staple序列。
最后,研究人员利用SNUPI模拟系统进一步评估结构稳定性、柔性以及热波动特征,并通过AFM、凝胶电泳等实验验证生成结构是否能够正确折叠。

图1:Generative SNUPI整体工作流程。
结果
Generative SNUPI实现DNA origami的生成式设计
研究人员首先建立了完整的Generative SNUPI设计流程。该系统允许用户输入任意线条几何图案,包括简单轮廓、生物启发图形以及复杂kirigami结构。随后,扩散模型从随机噪声开始逐步生成符合目标形状的DNA点云结构。生成后的结构进一步经过DNA链路由算法处理,自动生成scaffold路径和staple序列,并输出原子级DNA origami模型。
研究人员还将SNUPI物理模拟系统集成进整个设计流程,使模型能够在生成阶段直接预测结构稳定性与柔性特征,从而减少实验试错成本。
扩散模型能够稳定生成高保真DNA结构
研究人员训练的扩散模型能够在碱基层面学习DNA origami结构分布。模型首先经历“加噪”过程,将真实结构逐步破坏为随机点云;随后在“去噪”阶段逐渐恢复真实结构几何。为了提高目标形状匹配能力,研究人员引入基于Wasserstein Distance(WD)的条件约束,使生成结构能够主动向目标几何收敛。
研究人员共测试了100种不同尺寸和复杂度的DNA结构。结果显示:
此外,研究人员还验证了模型不存在简单“记忆训练集”的问题。RMSD分析表明,大多数生成结构与训练样本明显不同,说明模型真正学习到了DNA结构分布规律,而不是复制已有数据。

图2:扩散模型生成过程与结构保真度分析。
Generative SNUPI显著扩展DNA origami设计空间
研究人员随后展示了大量复杂DNA origami设计案例。
这些设计包括:
与传统规则晶格设计方法不同,Generative SNUPI能够轻松生成弯曲边缘、倾斜连接以及高度非规则几何体。
研究人员强调,这类复杂自由形态结构过去通常需要大量手工设计与专家经验,而现在可以通过生成式AI自动完成。

图3:复杂自由形态DNA origami设计展示。
实验验证表明生成结构能够正确折叠
为了验证生成结构是否真正可实验实现,研究人员选择多个设计进行AFM与凝胶电泳实验。
首先,研究人员设计了两个“狗脸”结构。其中Face 1由于部分区域连接不足,模拟预测其局部RMSF较高,意味着结构柔性过大。AFM结果证实该结构确实出现局部塌陷与模糊区域。随后研究人员增加部分边连接,得到Face 2。新的设计显著降低结构偏差,AFM图像与目标轮廓更加一致。
接着,研究人员进一步验证了:
大多数结构均能够正确折叠,并获得超过80%的单体产率。
其中,OpenAI logo结构由于局部柔性较高而出现一定畸变;而hexa-chiral与rotating triangle结构则表现出预期中的动态开合行为。

图4:AFM实验验证与结构修正过程。
Generative SNUPI实现可重构结构与模块化组装
研究人员进一步利用Generative SNUPI设计具有机械变形能力的DNA超材料。
首先,他们构建了两种具有负泊松比特性的auxetic metastructure:
研究人员通过在连接点引入短单链gap降低局部刚性,使结构能够在外部连接器作用下完成“打开—闭合”转换。
AFM与凝胶实验显示:
这证明生成式AI不仅能够设计静态结构,还能够嵌入复杂机械响应机制。
随后,研究人员又设计了模块化“狗”结构,包括不同面部与身体模块。由于模型能够精确匹配模块接口几何形状,因此多个不同模块可以稳定组装。实验中,四种不同组合均成功形成二聚体结构,组装产率超过65%。

图5:DNA超材料动态变形与模块化组装。
讨论
这项研究首次系统性展示了扩散模型在DNA origami从头设计中的潜力。
与传统基于规则和人工经验的方法相比,Generative SNUPI最大的突破在于:它能够直接学习DNA纳米结构的几何先验,从而自动生成复杂自由形态结构。
研究人员通过SNUPI物理模拟系统解决了DNA纳米领域长期缺乏训练数据的问题,使生成式AI真正能够应用于DNA origami设计。
更重要的是,该系统不仅能够生成静态结构,还能够实现:
这些功能意味着DNA nanotechnology正在从“规则晶格时代”进入“自由生成时代”。
研究人员还指出,目前模型主要支持2HB wireframe结构,但未来可以进一步扩展至:
随着更多训练数据与深度学习分析工具加入,未来Generative SNUPI有望形成完整的“AI自动设计—物理预测—实验验证”闭环体系。
从更广泛角度来看,这项研究代表着DNA nanotechnology设计范式的重要转变:研究人员开始从基于规则的CAD设计,逐渐迈向数据驱动的生成式设计。Generative AI未来可能像RFdiffusion改变蛋白设计一样,重新定义DNA纳米结构工程。
整理 | DrugOne团队
参考资料
Truong-Quoc, C., Jeon, K., Kim, J. et al. De novo design of DNA origami with a generative diffusion model. Nat Commun (2026).
https://doi.org/10.1038/s41467-026-73578-z