大家好,我是邓飞,今天给大家介绍一下一年多点的随机区组试验如何进行方差分析和多重比较,因为国家区试试验都是使用的一年多点随机区组的试验,这里介绍一下分析方法,并给出一个方便的自动化网站,可以直接分析拿到结果。走起。

导读:国家区域试验(区试)是作物新品种审定的核心环节。本文以一年多点随机区组设计为例,系统讲解三个关键分析步骤——方差分析(区组嵌套于地点的混合模型)、多重比较(0.05 与 0.01 双水平 LSD)、以及地点变异系数计算(基于误差均方而非表型数据直接计算)——并附完整 R 代码,可直接用于实际数据分析。
1试验设计背景
国家区试通常采用随机完全区组设计(RCBD),在多个生态区的多个地点同时开展。典型结构为:
▶ 地点(Location):代表不同生态区或省份,是试验的"环境"因子 ▶ 品种(Cultivar/Genotype):待评价的参试品种,是研究的核心因子 ▶ 区组(Block/Replicate):每个地点内设置 3~4 个重复区组,用于控制地点内的土壤异质性
⚠️ 关键设计要点:区组嵌套于地点 各地点的区组是相互独立的——L1 的"第 1 区组"与 L2 的"第 1 区组"在地理上毫无关联。因此,区组必须作为地点的嵌套效应处理,不能作为跨地点的完全区组处理。这一点在模型设定上至关重要,直接影响误差项的正确性。
本文使用的示例数据包含 10 个地点(L1~L10)、9 个品种、每地点 4 个区组,共 360 条记录(性状为产量,单位 kg/m²)。
loc,cul,block,yield L1,1,1,2.205 L1,1,2,1.925 L2,1,1,2.400 …(共 360 行,10地点 × 9品种 × 4重复)
2方差分析:区组嵌套于地点的模型
2.1 模型结构
对于一年多点随机区组试验,标准的线性模型为:
# 完整模型公式 yijk= μ + Li+ Cj+ (LC)ij+ Bk(i)+ εijk # 各项说明 μ—— 总体均值 Li—— 地点 i 的主效应 Cj—— 品种 j 的主效应(关注重点) (LC)ij—— 地点 × 品种互作效应 Bk(i)—— 地点 i 内第 k 区组效应(嵌套效应) εijk —— 随机误差
❌ 常见错误:把区组当做完全因子处理
错误写法:yield ~ loc + cul + block + loc:cul
这隐含假设"第1区组"在所有地点具有相同含义,会导致:①自由度分配错误;②误差项估计不准确;③品种 F 检验结果失真。
✅ 正确写法:区组嵌套于地点
正确写法:yield ~ loc * cul + loc:block
展开等价于:yield ~ loc + cul + loc:cul + loc:block
loc:block 项即"区组嵌套于地点",每个地点各自估计区组方差,互不干扰。
2.2 R 代码实现
# 加载所需包library(agricolae) # 多重比较library(tidyverse) # 数据处理library(openxlsx) # 结果输出# 读取数据并因子化dd<-read.csv("one-year-locs.csv")ddcul <-as.factor(ddblock <-as.factor(dd
2.3 方差分析表结构
典型的一年多点方差分析表包含以下变异来源(括号内为本例数值):
变异来源 | 自由度 df | 均方 MS | F 值 |
|---|---|---|---|
地点 (loc) | L−1 = 9 | — | — |
品种 (cul) | C−1 = 8 | MScul | ★★ |
地点×品种 (loc:cul) | (L−1)(C−1) = 72 | MSL×C | |
区组(地点) [loc:block] | L(R−1) = 30 | MSB(L) | |
残差(误差) | 240 | MSe | — |
📌 自由度验算(本例:10地点 × 9品种 × 4区组) 地点:10 − 1 = 9 | 品种:9 − 1 = 8 | 地点×品种:9 × 8 = 72 区组(地点):10 × (4−1) = 30 | 总 df:360 − 1 = 359 残差 df:359 − 9 − 8 − 72 − 30 = 240
3多重比较:0.05 与 0.01 双水平 LSD
3.1 为什么要做双水平多重比较?
国家区试品种审定标准通常要求同时给出品种在 0.05(显著) 和 0.01(极显著) 两个显著性水平的差异归组结果,分别用小写字母和大写字母标记,便于直观判断各品种的相对位置。
小写字母(a, b, c …)代表 0.05 水平显著差异;大写字母(A, B, C …)代表 0.01 水平极显著差异。相同字母表示差异不显著,不同字母表示存在显著差异。
3.2 LSD 法统计量
LSDα = tα, df_e × √( 2 × MSe / n ) # tα, df_e —— 误差自由度下的 t 临界值 # MSe —— 方差分析的残差均方 # n —— 每个处理的重复总数(地点数 × 区组数) # 两品种均值差 > LSD 时,认为差异显著
3.3 结果示例
品种 | 均值 (kg/m²) | 0.05 水平(小写字母) | 0.01 水平(大写字母) |
|---|---|---|---|
品种 3 | 2.334 | a | A |
品种 10 | 2.240 | ab | A |
品种 6 | 2.142 | b | AB |
品种 1 | 2.088 | bc | B |
品种 5 | 2.047 | bc | B |
品种 7 | 1.950 | cd | BC |
品种 8 | 1.878 | d | C |
品种 2 | 1.867 | d | C |
品种 4 | 1.866 | d | C |
💡 双水平结果解读技巧 ▶ 0.05 字母组区分更细,显著差距"门槛"更低 ▶ 0.01 字母组区分更粗,只有差异很大时才分到不同组 ▶ 在 0.01 水平字母仍不同,说明品种间差距相当可观 ▶ 审定时通常要求优良品种在两个水平均显著优于对照
4地点变异系数:基于误差均方计算
4.1 为什么不能用表型数据直接计算 CV?
许多初学者会直接用该地点所有观测值的标准差除以均值来得到变异系数(CV)。这看似直观,却存在严重缺陷:
❌ 表型 CV 的问题
错误公式:CV = sd(yield) / mean(yield)
该公式将品种间差异也纳入了"变异"的计算——如果一个地点的参试品种本身高矮悬殊,即使该试验点精度很高,这个 CV 也会虚高,无法反映试验的真实误差水平。
✅ 正确做法:用误差均方(MSE)计算 CV MSE 是方差分析中扣除了品种效应和区组效应后的纯误差,真正代表试验的重复精度。用 MSE 计算的 CV 才是衡量试验点"可靠性"的正确指标。
4.2 计算原理与公式
CVi = √MSEi / Ȳi × 100% # MSEi —— 地点 i 单点 RCBD 方差分析的残差均方 # Ȳi —— 地点 i 所有观测值的均值 # √MSEi —— 即该地点的试验误差标准差
4.3 结果示例与精度评价
地点 | 均值 | MSE | √MSE | CV (%) | 精度 |
|---|---|---|---|---|---|
L1 | 1.807 | 0.0312 | 0.177 | 9.8% | ✓ 合格 |
L2 | 1.856 | 0.0284 | 0.169 | 9.1% | ✓ 合格 |
L3 | 2.270 | 0.0198 | 0.141 | 6.2% | ★ 优良 |
L4 | 1.829 | 0.0456 | 0.214 | 11.7% | ⚠ 偏高 |
L5 | 2.036 | 0.0267 | 0.163 | 8.0% | ✓ 合格 |
L6 | 2.147 | 0.0159 | 0.126 | 5.9% | ★ 优良 |
L7 | 1.939 | 0.0321 | 0.179 | 9.2% | ✓ 合格 |
L8 | 1.828 | 0.0445 | 0.211 | 11.5% | ⚠ 偏高 |
L9 | 1.588 | 0.0198 | 0.141 | 8.9% | ✓ 合格 |
L10 | 2.240 | 0.0154 | 0.124 | 5.5% | ★ 优良 |
📊 CV 精度评价参考标准 ▶ CV ≤ 8%:试验精度优良,数据可靠性高 ▶ 8% < CV ≤ 10%:试验精度合格,数据可用 ▶ 10% < CV ≤ 15%:试验精度偏低,结果使用时需谨慎 ▶ CV > 15%:试验精度不合格,结果通常不予采用 注:具体阈值因作物和性状而异,以各作物区试实施方案规定为准。
5完整分析流程
① 数据整理:loc / cul / block / trait 四列格式 ↓ ② 全局方差分析:yield ~ loc * cul + loc:block ↓ ③ 品种多重比较(0.05 水平)→ 小写字母 ↓ ④ 品种多重比较(0.01 水平)→ 大写字母 ↓ ⑤ 各地点单独 RCBD → 提取 MSE → 计算 CV ↓ ⑥ 汇总输出:方差分析表 + 多重比较表 + CV 表
6核心知识点回顾
▶区组必须嵌套于地点:模型中须用 loc:block 而非单独的 block,否则自由度和 F 检验均出错
▶完整模型:yield ~ loc * cul + loc:block,含地点主效、品种主效、地点×品种互作、嵌套区组四个效应
▶CV 基于误差均方:单点 RCBD 方差分析表残差行取 MSE,公式 CV = √MSE / 均值,才是真正的试验精度指标
▶表型 CV ≠ 误差 CV:直接用 sd/mean 计算的 CV 包含品种间差异,不能作为试验精度指标
7自动化平台分析演示
网址:www.asreml.cn

找到“植物模块”-->方差分析与多重比较 --> 一年多点:
数据格式:

上传数据,选择地点、品种、区组和产量,导入到对应的列:(如果稍等一会,AI会自动根据数据结构自动导入,666)

下载结果:

邮箱中还可以得到AI结果解读:

不用编写代码,全程鼠标操作,就能得到最专业的分析!