【YOLOV5 |
您所在的位置:网站首页 › 官方源码有什么用 › 【YOLOV5 |
目录
前言1、参数配置2、anchors配置3、backbone4、head5、整体模型总结Reference
前言
源码: YOLOv5源码. 链接: 【YOLOV5-5.x 源码讲解】整体项目文件导航. 注释版全部项目文件已上传至GitHub: yolov5-5.x-annotations. \qquad YOLO V5不再采用.cfg配置文件了,而是使用了新的.yaml配置文件,方便进行基于函数式的模块化开发。下面会对模型配置文件 yolov5s.yaml 进行讲解。 先附上yolov5s的网络结构图:
\qquad
在打开模型配置文件的时候,有时候会显示一些乱码错误如:’utf’ 、'gbk’等字样,那通常是你的配置文件中有中文注释,所以报错。应该在打开配置文件的时候使用UTF-8的格式打开: 这个文件主要设置了三个参数,会用于模型搭建 yolo.py 文件中 如下:
\qquad
第二个参数是depth_multiple,用于控制模型的深度。通过深度参数 depth gain 在搭建每一层的时候,实际深度 = 理论深度( 每一层的参数n) * depth_multiple,这样就可以起到一个动态调整模型深度的作用。如下图: \qquad yolov5初始化了9个anchors,在三个Detect层使用(3个feature map)中使用,每个feature map的每个grid_cell都有三个anchor进行预测。分配的规则是:尺度越大的feature map越靠前,相对原图的下采样率越小,感受野越小,所以相对可以预测一些尺度比较小的物体,所有分配到的anchors越小;尺度越小的feature map越靠后,相对原图的下采样率越大,感受野越大,所以相对可以预测一些尺度比较大的物体,所有分配到的anchors越大。即可以在小特征图(feature map)上检测大目标,也可以在大特征图上检测小目标。 \qquad yolov5根据工程经验得到了这么3组anchors,对于很多数据集而言确实挺合适的。但是也不能保证这3组anchors就适用于所有的数据集,所有yolov5还有一个anchor进化的策略:使用k-means和遗传进化算法,找到与当前数据集最吻合的anchors。具体的代码细节可以看我的这篇博文链接: 【YOLOV5-5.x 源码解读】autoanchor.py。里面很详细的讲解了如何使用这个策略以及代码理解,这里就不多说了。 3、backbone backbone: # [from, number, module, args] # from表示当前模块的输入来自那一层的输出,-1表示来自上一层的输出 # number表示本模块重复的次数,1表示只有一个,3表示重复3次 # module: 模块名 [[-1, 1, Focus, [64, 3]], # 0-P1/2 [3, 32, 3] [-1, 1, Conv, [128, 3, 2]], # 1-P2/4 [32, 64, 3, 2] [-1, 3, C3, [128]], # 2 [64, 64, 1] [-1, 1, Conv, [256, 3, 2]], # 3-P3/8 [64, 128, 3, 2] [-1, 9, C3, [256]], # 4 [128, 128, 3] [-1, 1, Conv, [512, 3, 2]], # 5-P4/16 [128, 256, 3, 2] [-1, 9, C3, [512]], # 6 [256, 256, 3] [-1, 1, Conv, [1024, 3, 2]], # 7-P5/32 [256, 512, 3, 2] [-1, 1, SPP, [1024, [5, 9, 13]]], # 8 [512, 512, [5, 9, 13]] [-1, 3, C3, [1024, False]], # 9 [512, 512, 1, False] # [nc, anchors, 3个Detect的输出channel] # [1, [[10, 13, 16, 30, 33, 23], [30, 61, 62, 45, 59, 119], [116, 90, 156, 198, 373, 326]], [128, 256, 512]] ]\qquad 这是yolov5s的backbone,可以看到每一个模块算一行,每行都由四个参数构成。分别是: from:表示当前模块的输入来自那一层的输出,-1表示来自上一层的输出。number: 表示当前模块的理论重复次数,实际的重复次数还要由上面的参数depth_multiple共同决定,决定网络模型的深度。module:模块类名,通过这个类名去common.py中寻找相应的类,进行模块化的搭建网络。args: 是一个list,模块搭建所需参数,channel,kernel_size,stride,padding,bias等。会在网络搭建过程中根据不同层进行改变: BottleneckCSP, C3, C3TR:![]() ![]() ![]() YOLOv5 head = PANet+Detect # YOLOv5 head 作者没有区分neck模块,所以head部分包含了PANet+Detect部分 head: [[-1, 1, Conv, [512, 1, 1]], # 10 [512, 256, 1, 1] [-1, 1, nn.Upsample, [None, 2, 'nearest']], # 11 [None, 2, 'nearest'] [[-1, 6], 1, Concat, [1]], # 12 cat backbone P4 [1] [-1, 3, C3, [512, False]], # 13 [512, 256, 1, False] [-1, 1, Conv, [256, 1, 1]], # 14 [256, 128, 1, 1] [-1, 1, nn.Upsample, [None, 2, 'nearest']], #15 [None, 2, 'nearest'] [[-1, 4], 1, Concat, [1]], # 16 cat backbone P3 [1] [-1, 3, C3, [256, False]], # 17 (P3/8-small) [256, 128, 1, False] [-1, 1, Conv, [256, 3, 2]], # 18 [128, 128, 3, 2] [[-1, 14], 1, Concat, [1]], # 19 cat head P4 [1] [-1, 3, C3, [512, False]], # 20 (P4/16-medium) [256, 256, 1, False] [-1, 1, Conv, [512, 3, 2]], # 21 [256, 256, 3, 2] [[-1, 10], 1, Concat, [1]], # 22 cat head P5 [1] [-1, 3, C3, [1024, False]], # 23 (P5/32-large) [512, 512, 1, False] [[17, 20, 23], 1, Detect, [nc, anchors]], # 24 Detect(P3, P4, P5) ]可以看到,和backbone的很像,也是由4个参数构成: from: 表示当前模块的输入来自那一层的输出,-1表示来自上一层的输出。不过这里可以为list,就是这层的输入由所层输出concat而来。number:表示当前模块的理论重复次数,实际的重复次数还要由上面的参数depth_multiple共同决定,决定网络模型的深度。module:模块类名,通过这个类名去common.py中寻找相应的类,进行模块化的搭建网络。args:也是是一个list,模块搭建所需参数,channel,kernel_size,stride,padding,bias等。 5、整体模型 from n params module arguments 0 -1 1 3520 models.common.Focus [3, 32, 3] 1 -1 1 18560 models.common.Conv [32, 64, 3, 2] 2 -1 1 18816 models.common.C3 [64, 64, 1] 3 -1 1 73984 models.common.Conv [64, 128, 3, 2] 4 -1 1 156928 models.common.C3 [128, 128, 3] 5 -1 1 295424 models.common.Conv [128, 256, 3, 2] 6 -1 1 625152 models.common.C3 [256, 256, 3] 7 -1 1 1180672 models.common.Conv [256, 512, 3, 2] 8 -1 1 656896 models.common.SPP [512, 512, [5, 9, 13]] 9 -1 1 1182720 models.common.C3 [512, 512, 1, False] 10 -1 1 131584 models.common.Conv [512, 256, 1, 1] 11 -1 1 0 torch.nn.modules.upsampling.Upsample [None, 2, 'nearest'] 12 [-1, 6] 1 0 models.common.Concat [1] 13 -1 1 361984 models.common.C3 [512, 256, 1, False] 14 -1 1 33024 models.common.Conv [256, 128, 1, 1] 15 -1 1 0 torch.nn.modules.upsampling.Upsample [None, 2, 'nearest'] 16 [-1, 4] 1 0 models.common.Concat [1] 17 -1 1 90880 models.common.C3 [256, 128, 1, False] 18 -1 1 147712 models.common.Conv [128, 128, 3, 2] 19 [-1, 14] 1 0 models.common.Concat [1] 20 -1 1 296448 models.common.C3 [256, 256, 1, False] 21 -1 1 590336 models.common.Conv [256, 256, 3, 2] 22 [-1, 10] 1 0 models.common.Concat [1] 23 -1 1 1182720 models.common.C3 [512, 512, 1, False] 24 [17, 20, 23] 1 67425 models.yolo.Detect [20, [[10, 13, 16, 30, 33, 23], [30, 61, 62, 45, 59, 119], [116, 90, 156, 198, 373, 326]], [128, 256, 512]] 总结\qquad 搭配着yolo.py一起看,会更清晰每个参数的作用。 ReferenceCSDN 王吉吉丫: YOLOv5.yaml文件 & 超参详细介绍. – 2021.08.17 16:22 |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |