与“分割”和“场景标记”相比，“语义分割”是什么？

2024-01-12

语义分割只是一种重复，还是“语义分割”和“分割”之间有区别？ “场景标记”或“场景解析”有区别吗？

像素级分割和像素级分割有什么区别？

（附带问题：当您拥有这种逐像素注释时，您是否可以免费获得对象检测，或者还有什么事情要做吗？）

请给出您的定义的来源。

使用“语义分割”的来源

乔纳森·朗、埃文·谢尔哈默、特雷弗·达雷尔：用于语义分割的全卷积网络 https://arxiv.org/abs/1605.06211。 CVPR，2015 年和 PAMI，2016 年
Hong、Seunghoon、Hyeonwoo Noh 和 Bohyung Han：“用于半监督语义分割的解耦深度神经网络”。arXiv 预印本 arXiv:1506.04924 http://arxiv.org/abs/1506.04924, 2015.
V. Lempitsky、A. Vedaldi 和 A. Zisserman：用于语义分割的 pylon 模型。神经信息处理系统进展，2011 年。

使用“场景标签”的来源

克莱门特·法拉贝特、卡米尔·库普里、洛朗·纳吉曼、扬·勒昆：学习层次特征用于场景标记 http://yann.lecun.com/exdb/publis/pdf/farabet-pami-13.pdf。在模式分析和机器智能，2013 年。

使用“像素级”的源

Pinheiro、Pedro O. 和 Ronan Collobert：“使用卷积网络从图像级标记到像素级标记。” IEEE 计算机视觉和模式识别会议论文集，2015 年。（参见http://arxiv.org/abs/1411.6228 http://arxiv.org/abs/1411.6228)

使用“pixelwise”的来源

Li、宏升、赵锐和王晓刚：“用于像素分类的卷积神经网络的高效前向和后向传播。”arXiv 预印本 arXiv:1412.4526 http://arxiv.org/abs/1412.4526, 2014.

谷歌 Ngram

最近“语义分割”似乎比“场景标注”用得更多

“分割”是将图像分割成几个“连贯”的部分，但是without任何试图理解这些部分代表什么的尝试。最著名的作品之一（但绝对不是第一部）是Shi 和 Malik“标准化剪切和图像分割”PAMI 2000 http://www.cs.berkeley.edu/~malik/papers/SM-ncut.pdf。这些作品试图根据颜色、纹理和边界平滑度等低级线索来定义“连贯性”。这些作品你可以追溯到格式塔理论 https://en.wikipedia.org/wiki/Gestalt_psychology.

另一方面“语义分割”尝试将图像划分为语义上有意义的部分，and将每个部分分类为预先确定的类别之一。您还可以通过对每个像素（而不是整个图像/片段）进行分类来实现相同的目标。在这种情况下，您正在进行像素级分类，这会导致相同的最终结果，但路径略有不同......

所以，我想你可以说“语义分割”、“场景标记”和“像素分类”基本上都在试图实现相同的目标：从语义上理解图像中每个像素的作用。您可以采取多种途径来实现该目标，而这些途径会导致术语中出现细微差别。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)