首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >QIIME 2 2026.1 版本更新:性能优化与重要功能前瞻

QIIME 2 2026.1 版本更新:性能优化与重要功能前瞻

作者头像
用户1075469
发布2026-03-25 12:31:41
发布2026-03-25 12:31:41
1390
举报

QIIME 2团队在新年伊始发布了2026.1版本。本次更新虽然规模不大,主要侧重于内部维护,但仍包含一些对生信分析流程具有实用价值的改进和新功能,例如宏基因组方面的蛋白质序列和基因组数据的支持。

重要变更与未来规划

本次更新带来了一些值得关注的调整,尤其是对用户未来使用环境的规划。

首先,核心框架更名为 rachis。原本的 qiime2 框架现已更名为 rachis,并已在GitHub和PyPI上提供。为了确保兼容性,开发团队添加了向后兼容层,因此您现有的代码中通过 import qiime2 的方式仍可正常工作。这为未来的发展奠定了基础。

其次,关于发行版与Mac用户的更新值得留意。团队预告,在下个版本(2026.4)中,大家熟悉的扩增子分析发行版 “amplicon”将被重命名为“qiime2”,以更准确地反映其作为核心包集合的地位。同时,“moshpit”和“pathogenome”发行版中的部分插件将被精简。

小编评价:改来改去也是醉啦!

对于Mac用户,从2026.4版本开始,将分拆提供针对Intel芯片(osx-64)和Apple Silicon芯片(arm-64)的环境文件。这意味着如果您使用的是M1/M2等芯片的Mac,届时可以直接使用为arm-64构建的环境,无需再手动设置 CONDA_SUBDIR 变量。需要注意的是,2026.1版本将是最后一个为“moshpit”和“pathogenome”发行版提供macOS环境文件的版本。这主要是因为这两个发行版中的许多分析任务对计算资源要求较高,在Mac上运行体验不佳。如果您需要使用它们,建议转向使用高性能计算集群或Docker方式安装。

小编评价:一般人不用mac分析16S原始数据吧,依赖什么的还是照着linux差点!

核心功能改进与Bug修复

本次更新在核心框架和插件层面都进行了多项实用改进。

  • q2-feature-table 核心操作更新summarize 功能有了重要变化。原先的 summarize 可视化工具已被功能更强大的 summarize_plus 流程所取代。现在,新的 summarize 命令(即原来的 summarize_plus)提供了更丰富的输出信息。如果您在现有工作流中调用了旧的 summarize,需要更新您的脚本以适应新输出的变化。旧的 summarize 方法现被重命名为 _summarize 保留。
  • 内存与性能优化q2-boots 插件中的 medoid(中心点)计算解决了内存瓶颈问题。以前内存占用随数据量呈平方级增长,现在优化为线性增长,这使得处理更大规模的 n 值(如更大的重采样次数或数据量)成为可能。因此,medoid 现已成为距离矩阵平均化的默认方法。此外,q2cliqiime tools cache status 命令现在会按字母顺序列出缓存项,方便查找。
  • Bug修复:修复了多个影响分析准确性和稳定性的问题。例如,修复了双端测序数据导入时因样本ID部分重叠(如样本5和51)而导致验证失败的问题;修复了在使用 demux-* 命令时,batch_sizecut 参数组合可能导致序列被错误多次剪切的问题;以及修复了在特定情况下无法使用 provenance replay 功能的问题。
  • Python API 易用性提升:所有 provenance replay 相关的功能现在可以直接与 Results 对象协同工作。这意味着在Python API中进行流程重演时,您可以直接加载和传入Artifact对象,而无需再手动处理复杂的zip文件,大大简化了代码编写。

插件新功能:扩展分析能力

多个插件增加了实用的新功能,尤其扩展了对蛋白质序列和基因组数据的支持。

  • 蛋白质序列支持 (q2-alignment)mafftmafft-addmask 操作现在支持蛋白质序列。同时,mafft 工具也开放了更多底层的比对策略供用户选择,而不再仅限于默认算法,为序列比对提供了更大灵活性。
  • 增强的BUSCO评估 (q2-annotate)evaluate-busco 生成的交互式可视化图表响应更快、更易用。需要注意的是,由于BUSCO内部机制问题,本次移除了“auto-lineage”相关参数,暂不支持谱系的自动分配功能。
  • Kraken 2结果处理 (q2-annotate):新增了将Kraken 2的物种注释信息映射回序列片段(contigs)并进行丰度汇总的工作流程,通过 map-taxonomy-to-contigscollapse-contigs 两个操作实现,方便了宏基因组组装后的物种注释与整理。
  • 模拟测序数据 (q2-assembly)simulate-reads-mason 操作现在支持根据已有的特征表(feature table)中定义的序列频率来生成模拟 reads,这为基于真实数据的模拟和 benchmark 分析提供了便利。
  • 数据类型扩展 (q2-types):增加了对基因组分区数据的支持,例如 GenomeData[Genes] 等。同时新增了 AnnotationToContigs 格式及相关类型,用于存储从注释(如物种或功能)到序列片段(contigs)的映射关系。

总结

QIIME 2 2026.1 版本为未来的重要变化(如发行版更名、Mac环境拆分)做好了铺垫,同时通过优化核心算法(如medoid内存使用)、修复关键bug和扩展插件功能(尤其是对蛋白质和基因组数据的支持),切实提升了平台的性能和实用性。建议用户关注即将于2026.4版本发生的变化,并据此规划自己的分析环境。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-03-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 微因 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 重要变更与未来规划
  • 核心功能改进与Bug修复
  • 插件新功能:扩展分析能力
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档