UDA（Unsupervised Data Augmentation）

2024-07-12 06:06| 来源: 网络整理| 查看: 265

1 简介

当标注好的数据很少时，半监督学习在深度学习模型中有非常好的表现。目前常用的方法是一致性训练，基于大量的非标注数据进行训练来使模型可以应对各种输入噪声（或者隐状态的噪声）。

有些方法是来设计各种噪声注入模型进行训练，如附加高斯噪声、dropout、对抗噪声。

而UDA（Unsupervised Data Augmentation）是强调这些优秀数据增强方法的使用。不过从名字就可以看出来，UDA是对非标注数据进行数据增强，以前的方法一般是对标注数据增强。

本文依据2020年《Unsupervised Data Augmentation for Consistency Training》翻译总结。

主要贡献如下： 1）我们显示在监督学习中优秀的数据增强方法也适用于半监督学习的一致性训练中。 2）UDA可以媲美甚至超越监督学习的效果。而这些监督学习却使用了比UDA非常多的标注数据。无论是在视觉任务还是语言任务上。UDA只需使用很少的标注数据。 3）UDA也可以利用迁移学习，如fine-tuning后的BERT，加上UDA可以取得更好的成绩。同时UDA在大数据量的ImageNet上也有效。 4）同时我们进行了UDA的理论分析。

2 Unsupervised Data Augmentation

UDA的目标函数公式如下，示意图也如下。可以看到分为两部分，第一部分是Supervised Cross-entropy Loss，第二部分是Unsupervised Consistency Loss。第二部分又是求数据增强后和数据增强前的一致性（CE那部分）。可以看到数据增强部分是对非标注数据进行的，不像传统的方法是对标注数据进行的。在这里插入图片描述