语义分割只是一种重复,还是“语义分割”和“分割”之间有区别? “场景标记”或“场景解析”有区别吗?
像素级分割和像素级分割有什么区别?
(附带问题:当您拥有这种逐像素注释时,您是否可以免费获得对象检测,或者还有什么事情要做吗?)
请给出您的定义的来源。
使用“语义分割”的来源
- 乔纳森·朗、埃文·谢尔哈默、特雷弗·达雷尔:用于语义分割的全卷积网络 https://arxiv.org/abs/1605.06211。 CVPR,2015 年和 PAMI,2016 年
- Hong、Seunghoon、Hyeonwoo Noh 和 Bohyung Han:“用于半监督语义分割的解耦深度神经网络”。arXiv 预印本 arXiv:1506.04924 http://arxiv.org/abs/1506.04924, 2015.
- V. Lempitsky、A. Vedaldi 和 A. Zisserman:用于语义分割的 pylon 模型。神经信息处理系统进展,2011 年。
使用“场景标签”的来源
- 克莱门特·法拉贝特、卡米尔·库普里、洛朗·纳吉曼、扬·勒昆:学习层次特征
用于场景标记 http://yann.lecun.com/exdb/publis/pdf/farabet-pami-13.pdf。在模式分析和机器智能,2013 年。
使用“像素级”的源
- Pinheiro、Pedro O. 和 Ronan Collobert:“使用卷积网络从图像级标记到像素级标记。” IEEE 计算机视觉和模式识别会议论文集,2015 年。(参见http://arxiv.org/abs/1411.6228 http://arxiv.org/abs/1411.6228)
使用“pixelwise”的来源
- Li、宏升、赵锐和王晓刚:“用于像素分类的卷积神经网络的高效前向和后向传播。”arXiv 预印本 arXiv:1412.4526 http://arxiv.org/abs/1412.4526, 2014.
谷歌 Ngram
最近“语义分割”似乎比“场景标注”用得更多
“分割”是将图像分割成几个“连贯”的部分,但是without任何试图理解这些部分代表什么的尝试。最著名的作品之一(但绝对不是第一部)是Shi 和 Malik“标准化剪切和图像分割”PAMI 2000 http://www.cs.berkeley.edu/~malik/papers/SM-ncut.pdf。这些作品试图根据颜色、纹理和边界平滑度等低级线索来定义“连贯性”。这些作品你可以追溯到格式塔理论 https://en.wikipedia.org/wiki/Gestalt_psychology.
另一方面“语义分割”尝试将图像划分为语义上有意义的部分,and将每个部分分类为预先确定的类别之一。您还可以通过对每个像素(而不是整个图像/片段)进行分类来实现相同的目标。在这种情况下,您正在进行像素级分类,这会导致相同的最终结果,但路径略有不同......
所以,我想你可以说“语义分割”、“场景标记”和“像素分类”基本上都在试图实现相同的目标:从语义上理解图像中每个像素的作用。您可以采取多种途径来实现该目标,而这些途径会导致术语中出现细微差别。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)