即 device0:layer0-3, device1:layer4-7,等等。
• 策略:之前4个设备,每个设备有4层模型参数,即 device0:layer0-3, device1:layer4-7,等等。