首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器之心

    用扩散模型生成网络参数,LeCun点赞尤洋团队新研究

    为了解答这个问题,该团队使用两个小型架构进行了实验:MLP-3 和 ConvNet-3。其中 MLP-3 包含三个线性层和 ReLU 激活函数,ConvNet-3 则包含三个卷积层和一个线性层。 其中报告了 ConvNet-3 在 CIFAR-10/100 以及 MLP-3 在 CIFAR-10 和 MNIST 上的结果比较和参数数量。

    54410编辑于 2024-02-26
  • 来自专栏未来先知

    卡内基梅隆大学 & 微软研究院引入 Med-VTAB 用通用预训练权重提高ViTs在视觉任务上性能 !

    这个类别专注于适应模型的最后几层( Head ),策略包括:1) 线性概率:微调单个线性层作为分类头;2) MLP-3:使用三层多层感知机适应作为分类头;3) Partial-1 [27]:只微调主干网络的最后一个块 同时,尽管GMoE-Adapter与MLP-3具有可比的可训练参数,但GMoE-Adapter的性能仍大幅领先。这些显著的改进证明了作者方法在医学图像分类适应方面的优越性。

    40110编辑于 2024-08-08
领券