我有一个像这样的文件,
REF QUERY COVR COVQ
sca_10_chr8_2_0 scaffold_2 0.08 2.48
sca_10_chr8_2_0 scaffold_1 0.02 0.02
sca_10_chr8_2_0 scaffold_2 0.22 0.06
sca_10_chr8_2_0 scaffold_2 0.21 0.05
sca_10_chr8_2_0 scaffold_1 0.21 0.27
sca_10_chr8_2_0 scaffold_2 0.21 0.64
sca_10_chr8_2_0 scaffold_4 0.20 0.06
sca_10_chr8_2_0 scaffold_8 0.20 0.07
sca_10_chr8_2_0 scaffold_10 0.21 0.08对于第1和第2列的每个不同组合,或基于第1和第2列的重复组合,我希望将第4列(总覆盖范围)和如下所示的输出文件:
REF QUERY COVQ
sca_10_chr8_2_0 scaffold_2 1.52
sca_10_chr8_2_0 scaffold_1 0.29
sca_10_chr8_2_0 scaffold_4 0.06
sca_10_chr8_2_0 scaffold_8 0.07
sca_10_chr8_2_0 scaffold_10 0.08发布于 2021-05-20 23:17:47
使用米勒:
$ mlr --pprint --ofmt '%.2f' stats1 -a sum -g REF,QUERY -f COVQ yourfile
REF QUERY COVQ_sum
sca_10_chr8_2_0 scaffold_2 3.23
sca_10_chr8_2_0 scaffold_1 0.29
sca_10_chr8_2_0 scaffold_4 0.06
sca_10_chr8_2_0 scaffold_8 0.07
sca_10_chr8_2_0 scaffold_10 0.08https://unix.stackexchange.com/questions/650672
复制相似问题