为了解答这个问题,该团队使用两个小型架构进行了实验:MLP-3 和 ConvNet-3。其中 MLP-3 包含三个线性层和 ReLU 激活函数,ConvNet-3 则包含三个卷积层和一个线性层。 其中报告了 ConvNet-3 在 CIFAR-10/100 以及 MLP-3 在 CIFAR-10 和 MNIST 上的结果比较和参数数量。
这个类别专注于适应模型的最后几层( Head ),策略包括:1) 线性概率:微调单个线性层作为分类头;2) MLP-3:使用三层多层感知机适应作为分类头;3) Partial-1 [27]:只微调主干网络的最后一个块 同时,尽管GMoE-Adapter与MLP-3具有可比的可训练参数,但GMoE-Adapter的性能仍大幅领先。这些显著的改进证明了作者方法在医学图像分类适应方面的优越性。