首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏YOLO大作战

    RT-DETR优化改进:SPD-Conv,低分辨率图像和小物体涨点明显,涨点神器,无脑直接使用!!!

    图像转换技术[29]来对CNN内部和整个CNN的特征映射进行下采样:​ 考虑任意大小为S × S × C1的中间特征映射X,将子特征映射序列切片为:2.Yolov5-SPD网络结构图只需更换YOLOv5 stride 有7个这样的替换实例,因为YOLOv5在主干中使用5个stride-2卷积层对特征图进行25倍的下采样,在neck使用2个stride-2卷积层。

    1.8K20编辑于 2023-11-19
  • 来自专栏晓飞的算法工程笔记

    ResNet-RS:谷歌领衔调优ResNet,性能全面超越EfficientNet系列 | 2021 arxiv

    3)将下采样模块的skip路径中的stride-2 $1\times 1$卷积替换为stride-2 $2\times 2$平均池化和non-strided $1\times 1$卷积。 4)去掉stem中的stride-2 $3\times 3$最大池化层,在下个bottleneck的首个$3\times 3$卷积中进行下采样。

    64610编辑于 2022-07-06
  • 来自专栏DeepHub IMBA

    论文推荐:TResNet改进ResNet 实现高性能 GPU 专用架构并且效果优于 EfficientNet

    SpaceToDepth Stem ResNet50 stem 由一个 stride-2 conv7×7 和一个最大池化层组成。ResNet-D 将 conv7×7 替换为三个 conv3×3 层。 Anti-Alias Downsampling (AA) stride-2 卷积被 stride-1 卷积替换,然后是一个 3×3 的步长为 2的blur filter。

    1.3K10编辑于 2022-11-11
  • 来自专栏相约机器人

    [CVPR 2019] Pose2Seg:检测免费的人体实例分割

    SegModule:是一个CNN网络,以7 x 7 stride-2 conv层开始,后面跟着几个标准剩余单元。然后,使用双线性上采样层来恢复分辨率,并使用1×1转换层来预测掩模结果。

    5.3K40发布于 2019-06-21
  • 来自专栏CVer

    46.1 mAP!MimicDet:缩小一阶段和两阶段目标检测之间的差距 | ECCV 2020

    具体来说,P6在C5上采用3×3 stride-2卷积生成,P7在P6上采用ReLU后加3×3 stride-2 conv计算。所有特征金字塔的通道数为256。

    1.5K30发布于 2020-09-29
  • 来自专栏OpenMMLab

    让 GLEAN 还原你女神的美妙容颜

    然后,我们通过以下方法逐渐降低特征的分辨率: 其中 Ei (i =1, 2, …, N)表示一个 stride-2 卷积和 stride-1 卷积的堆栈。

    47410编辑于 2022-01-18
  • 来自专栏人工智能前沿讲习

    生成对抗网络在图像翻译上的应用【附PPT与视频资料】

    在网络设计方面,生成器的结构采用当下比较流行的框架:包含2个stride-2 的卷积块, 几个residualblocks 和两个0.5-strided卷积完成上采样过程。

    1.7K30发布于 2020-05-11
  • 来自专栏机器之心

    苹果、俄勒冈州立提出AutoFocusFormer: 摆脱传统栅格,采用自适应下采样的图像分割

    传统的 stride-2 下采样会将数量减少至 1/4,而 AFF 更为灵活的点云结构则对 x% 的值没有限制。实验中,作者们展示了采取 1/4 和 1/5 下采样率的模型的训练结果。

    68920编辑于 2023-08-07
  • 来自专栏AI科技评论

    8 篇论文深入学习深度估计:深度预测;自我运动学习;观看冰雪奇缘了解移动人物深度

    该网络由7个stride-2卷积以及紧随其后的1 x 1卷积和 6 ∗(N -1)个输出通道组成,这些对应于每个源的3个欧拉角和3D平移。全局平均值应用于所有空间位置的合成预测。

    2.6K20发布于 2019-10-31
  • 来自专栏用户9703952的专栏

    RetinaNet网络详解

    feature_size, feature_size, kernel_size=3, stride=1, padding=1) # "P6 is obtained via a 3x3 stride , kernel_size=3, stride=2, padding=1) # "P7 is computed by applying ReLU followed by a 3x3 stride

    65410编辑于 2025-02-04
  • 来自专栏集智书童

    迟到的 HRViT | Facebook提出多尺度高分辨率ViT,这才是原汁原味的HRNet思想

    另一方面,并没有像之前的ViTs那样简单地使用stride-4卷积,而是遵循HRNet中的设计,使用2个stride-2 convn-bn-relu块作为一个更强的下采样来提取c通道特征,并保留更多的信息

    2.2K20发布于 2021-11-17
  • 来自专栏媒矿工厂

    ViT-Adapter: 密集预测任务的ViT适配器

    然后,使用一堆 stride-2 3×3 卷积将通道数量加倍并减小特征图的大小。最后,最后应用多个 1×1 卷积将特征图投影到 D 维度。

    1.3K10编辑于 2024-03-26
  • 来自专栏SnailTyan

    Squeeze-and-Excitation Networks论文翻译——中文版

    (c) The down-sampling projection 1×11\times 1 with stride-2 convolution was replaced with a 3×33\times 3 stride-2 convolution to preserve information.

    1.7K100发布于 2017-12-29
  • 来自专栏AIUAI

    网络结构之 Inception V2

    参考表格. [4] - 两个 Inception 模块间不再使用 pooling 层;而在模块 3c 和 4e 中的 concatenation 前采用了 stride-2 conv/pooling 层

    2.4K20发布于 2019-02-18
  • 来自专栏SnailTyan

    Squeeze-and-Excitation Networks论文翻译——中英文对照

    (c) The down-sampling projection 1×11\times 1 with stride-2 convolution was replaced with a 3×33\times 3 stride-2 convolution to preserve information.

    1.6K00发布于 2017-12-28
  • 来自专栏AIUAI

    网络结构之 Inception V3

    采用两个并行的步长 stride-2 操作. ? 4. Inception V3 网络结构. ? 采用 Figure 10 中的方法降低不同 Inception 模块间的网格尺寸.

    4.3K30发布于 2019-02-18
领券