mask

2024-03-14 23:14| 来源: 网络整理| 查看: 265

论文：http://cn.arxiv.org/pdf/1703.06870v3 介绍时所采用的Mask-RCNN源码（python版本）来源于GitHub：https://github.com/matterport/Mask_RCNN

1.图像增强概念

上一篇博客讲述了如何进行图像缩放，本篇主要讲解常用的一些数据增强的方法及适用场景。深度学习是基于大数据的一种方法，数据规模越大，质量越高，模型的泛化能力越强。当数据集比较小时，除了通过收集更多数据，还可以利用图像增强的方法来扩充数据集。数据增强，就是对原始图像进行一定的图像处理。一方面在一定程度上提升模型的泛化能力；另一方面还可以达到提升模型鲁棒性的效果，比如增加噪声数据。

2.图像增强分类离线增强：在训练过程前对数据集m进行处理，数据数目变为原数据的n倍。模型学习的样本变为m*n。该方法适用于数据集比较小时，扩充后的数据需要占用一定的存储空间。在线增强：在训练过程中对数据集m进行处理，获得一个 batch 的数据之后，然后对这个 batch 的数据进行增强，最后再输入网络进行学习。模型学习的样本为m*epochs，随着epochs的增大，该方式学习的样本数量要远比离线方式多。这种方式常用于大数据集以及图像处理用时较短时。很多机器学习框架已经支持了这种数据增强方式，并且可以使用 GPU 优化计算。 3.mask-rcnn图像增强方式

作者在源码中使用imgaug库进行图像增强，imgaug是一个封装好的用来进行图像增强的python库，官方文档：https://imgaug.readthedocs.io/en/latest/。其使用方法非常简单：

定义一个图像增强序列， augment_seq = imgaug.augmenters.Sequential( [增强1, 增强2, ...]) 调用模型的train方法时，传递给参数augmentation。 model.train(augmentation&#

【本文地址】

公司简介

联系我们