小图像数据集的数据增强技术?

2024-01-12

目前我正在训练类似于的小型徽标数据集Flickrlogos-32 http://www.multimedia-computing.de/flickrlogos/与深度 CNN。为了训练更大的网络,我需要更多的数据集,因此使用增强。我现在做的最好的事情是使用仿射变换(特征归一化、特征中心、旋转、宽度高度移位、水平垂直翻转)。但对于更大的网络,我需要更多的增强。我尝试在 Kaggle 的国家数据科学碗上搜索forum https://www.kaggle.com/c/datasciencebowl/forums/t/11360/data-augmentation但无法得到太多帮助。给出了一些方法的代码here https://github.com/benanne/kaggle-galaxies/blob/master/realtime_augmentation.py但我不确定什么会有用。除了仿射变换之外,还有哪些其他(或更好的)图像数据增强技术可以应用于此类(或任何一般图像)数据集?


可以找到一个很好的回顾here http://lamda.nju.edu.cn/weixs/project/CNNTricks/CNNTricks.html,关于数据增强的第 1 节:即flips, 随机作物 and 颜色抖动并且灯光噪音:

克里热夫斯基等人。 http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf在 2012 年训练著名的 Alex-Net 时提出了花式 PCA。花式 PCA 改变了训练图像中 RGB 通道的强度。

或者,您也可以查看 Kaggle Galaxy Zoo 挑战赛:获胜者写了一篇非常详细的博客文章 http://benanne.github.io/2014/04/05/galaxy-zoo.html。它涵盖了相同类型的技术:

  • 回转,
  • 翻译,
  • zoom,
  • flips,
  • 颜色扰动。

如前所述,他们也“实时进行,即在训练期间”。

例如这里有一个实用的Torch http://torch.ch/ 执行 https://github.com/facebook/fb.resnet.torch/blob/e8fb31378fd8dc188836cf1a7c62b609eb4fd50a/datasets/transforms.lua通过 Facebook(对于ResNet http://arxiv.org/abs/1512.03385训练)。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

小图像数据集的数据增强技术? 的相关文章

随机推荐