mask | 您所在的位置:网站首页 › cnn图像预处理 › mask |
论文:http://cn.arxiv.org/pdf/1703.06870v3 介绍时所采用的Mask-RCNN源码(python版本)来源于GitHub:https://github.com/matterport/Mask_RCNN 1.图像增强概念上一篇博客讲述了如何进行图像缩放,本篇主要讲解常用的一些数据增强的方法及适用场景。 深度学习是基于大数据的一种方法,数据规模越大,质量越高,模型的泛化能力越强。当数据集比较小时,除了通过收集更多数据,还可以利用图像增强的方法来扩充数据集。 数据增强,就是对原始图像进行一定的图像处理。一方面在一定程度上提升模型的泛化能力;另一方面还可以达到提升模型鲁棒性的效果,比如增加噪声数据。 2.图像增强分类 离线增强: 在训练过程前对数据集m进行处理,数据数目变为原数据的n倍。模型学习的样本变为m*n。该方法适用于数据集比较小时,扩充后的数据需要占用一定的存储空间。 在线增强 : 在训练过程中对数据集m进行处理,获得一个 batch 的数据之后,然后对这个 batch 的数据进行增强,最后再输入网络进行学习。模型学习的样本为m*epochs,随着epochs的增大,该方式学习的样本数量要远比离线方式多。这种方式常用于大数据集以及图像处理用时较短时。很多机器学习框架已经支持了这种数据增强方式,并且可以使用 GPU 优化计算。 3.mask-rcnn图像增强方式作者在源码中使用imgaug库进行图像增强,imgaug是一个封装好的用来进行图像增强的python库,官方文档:https://imgaug.readthedocs.io/en/latest/。其使用方法非常简单: 定义一个图像增强序列, augment_seq = imgaug.augmenters.Sequential( [增强1, 增强2, ...]) 调用模型的train方法时,传递给参数augmentation。 model.train(augmentation |
CopyRight 2018-2019 实验室设备网 版权所有 |