hugggingface上ems2的model card 紧接着,原团队核心成员成立 EvolutionaryScale 并发布生成式旗舰 ESM-3——参数规模再跃升、支持自然语言式“提示”,能模拟 ESM-3更是一个多模态的蛋白质语言模型,结合了蛋白质的结构和功能等特征。 return esm_ss3 该函数接收 ProteinChain 对象,先用 Biotite 的 annotate_sse 推断每个残基的二级结构(α-螺旋 a、β-折叠 b、无规卷曲 c),再映射成 ESM
数万亿碱基 近年来,研究者开发了日益强大的“蛋白质语言模型”,例如前Meta员工开发的ESM-3模型。
ProtDAT 可从多模态数据生成高质量蛋白序列 研究人员设计五种提示模式(仅文本、文本+N 端序列等),并与 ProGen2、ProtGPT2、ProLLaMA 与 ESM-3 对比生成 110,805
650M 参数) 、ESM-2 的多个变体 (8M, 35M, 150M, 650M, 3B 参数) 、Ankh (450M 和 1.15B 参数) 、ESM-C (300M 和 600M 参数) 和 ESM