QIIME 2团队在新年伊始发布了2026.1版本。本次更新虽然规模不大,主要侧重于内部维护,但仍包含一些对生信分析流程具有实用价值的改进和新功能,例如宏基因组方面的蛋白质序列和基因组数据的支持。
本次更新带来了一些值得关注的调整,尤其是对用户未来使用环境的规划。
首先,核心框架更名为 rachis。原本的 qiime2 框架现已更名为 rachis,并已在GitHub和PyPI上提供。为了确保兼容性,开发团队添加了向后兼容层,因此您现有的代码中通过 import qiime2 的方式仍可正常工作。这为未来的发展奠定了基础。
其次,关于发行版与Mac用户的更新值得留意。团队预告,在下个版本(2026.4)中,大家熟悉的扩增子分析发行版 “amplicon”将被重命名为“qiime2”,以更准确地反映其作为核心包集合的地位。同时,“moshpit”和“pathogenome”发行版中的部分插件将被精简。
小编评价:改来改去也是醉啦!
对于Mac用户,从2026.4版本开始,将分拆提供针对Intel芯片(osx-64)和Apple Silicon芯片(arm-64)的环境文件。这意味着如果您使用的是M1/M2等芯片的Mac,届时可以直接使用为arm-64构建的环境,无需再手动设置 CONDA_SUBDIR 变量。需要注意的是,2026.1版本将是最后一个为“moshpit”和“pathogenome”发行版提供macOS环境文件的版本。这主要是因为这两个发行版中的许多分析任务对计算资源要求较高,在Mac上运行体验不佳。如果您需要使用它们,建议转向使用高性能计算集群或Docker方式安装。
小编评价:一般人不用mac分析16S原始数据吧,依赖什么的还是照着linux差点!
本次更新在核心框架和插件层面都进行了多项实用改进。
q2-feature-table 核心操作更新:summarize 功能有了重要变化。原先的 summarize 可视化工具已被功能更强大的 summarize_plus 流程所取代。现在,新的 summarize 命令(即原来的 summarize_plus)提供了更丰富的输出信息。如果您在现有工作流中调用了旧的 summarize,需要更新您的脚本以适应新输出的变化。旧的 summarize 方法现被重命名为 _summarize 保留。q2-boots 插件中的 medoid(中心点)计算解决了内存瓶颈问题。以前内存占用随数据量呈平方级增长,现在优化为线性增长,这使得处理更大规模的 n 值(如更大的重采样次数或数据量)成为可能。因此,medoid 现已成为距离矩阵平均化的默认方法。此外,q2cli 的 qiime tools cache status 命令现在会按字母顺序列出缓存项,方便查找。demux-* 命令时,batch_size 与 cut 参数组合可能导致序列被错误多次剪切的问题;以及修复了在特定情况下无法使用 provenance replay 功能的问题。provenance replay 相关的功能现在可以直接与 Results 对象协同工作。这意味着在Python API中进行流程重演时,您可以直接加载和传入Artifact对象,而无需再手动处理复杂的zip文件,大大简化了代码编写。多个插件增加了实用的新功能,尤其扩展了对蛋白质序列和基因组数据的支持。
q2-alignment):mafft、mafft-add 和 mask 操作现在支持蛋白质序列。同时,mafft 工具也开放了更多底层的比对策略供用户选择,而不再仅限于默认算法,为序列比对提供了更大灵活性。q2-annotate):evaluate-busco 生成的交互式可视化图表响应更快、更易用。需要注意的是,由于BUSCO内部机制问题,本次移除了“auto-lineage”相关参数,暂不支持谱系的自动分配功能。q2-annotate):新增了将Kraken 2的物种注释信息映射回序列片段(contigs)并进行丰度汇总的工作流程,通过 map-taxonomy-to-contigs 和 collapse-contigs 两个操作实现,方便了宏基因组组装后的物种注释与整理。q2-assembly):simulate-reads-mason 操作现在支持根据已有的特征表(feature table)中定义的序列频率来生成模拟 reads,这为基于真实数据的模拟和 benchmark 分析提供了便利。q2-types):增加了对基因组分区数据的支持,例如 GenomeData[Genes] 等。同时新增了 AnnotationToContigs 格式及相关类型,用于存储从注释(如物种或功能)到序列片段(contigs)的映射关系。QIIME 2 2026.1 版本为未来的重要变化(如发行版更名、Mac环境拆分)做好了铺垫,同时通过优化核心算法(如medoid内存使用)、修复关键bug和扩展插件功能(尤其是对蛋白质和基因组数据的支持),切实提升了平台的性能和实用性。建议用户关注即将于2026.4版本发生的变化,并据此规划自己的分析环境。