使用 Mean Shift 进行图像分割的解释

2024-04-30

谁能帮我理解 Mean Shift 分割的实际工作原理吗？

这是我刚刚制作的一个 8x8 矩阵

  103  103  103  103  103  103  106  104   
  103  147  147  153  147  156  153  104   
  107  153  153  153  153  153  153  107   
  103  153  147  96   98   153  153  104   
  107  156  153  97   96   147  153  107   
  103  153  153  147  156  153  153  101   
  103  156  153  147  147  153  153  104   
  103  103  107  104  103  106  103  107

使用上面的矩阵是否可以解释 Mean Shift 分割如何分离 3 个不同级别的数字？

首先是基础知识：

Mean Shift 分割是一种局部均质化技术，对于抑制局部对象中的阴影或色调差异非常有用。一个例子胜过许多言语：

Action:将每个像素替换为范围 r 邻域中且其值在距离 d 内的像素的平均值。

均值平移通常需要 3 个输入：

用于测量像素之间距离的距离函数。通常是欧几里德距离，但也可以使用任何其他明确定义的距离函数。这曼哈顿距离 http://en.wikipedia.org/wiki/Taxicab_geometry有时是另一个有用的选择。
一个半径。该半径（根据上述距离测量）内的所有像素都将被纳入计算。
价值差异。对于半径 r 内的所有像素，我们将只取那些值在此差值内的像素来计算平均值

请注意，该算法在边界处没有明确定义，因此不同的实现会给您带来不同的结果。

我不会在这里讨论血淋淋的数学细节，因为如果没有正确的数学符号，它们就不可能显示，在 StackOverflow 中不可用，而且还因为它们可以找到来自其他地方的良好来源 http://saravananthirumuruganathan.wordpress.com/2010/04/01/introduction-to-mean-shift-algorithm/.

让我们看看矩阵的中心：

153  153  153  153 
147  96   98   153 
153  97   96   147   
153  153  147  156

通过合理选择半径和距离，四个中心像素将得到 97（其平均值），并且与相邻像素不同。

我们来计算一下数学 http://www.wolfram.com/mathematica/。我们将显示颜色编码，而不是显示实际数字，因此更容易理解正在发生的情况：

矩阵的颜色编码是：

然后我们采取合理的Mean Shift：

MeanShiftFilter[a, 3, 3]

我们得到：

其中所有中心元素都相等（顺便说一句，为 97）。

您可以使用均值平移迭代多次，尝试获得更均匀的着色。经过几次迭代后，您将获得稳定的非各向同性配置：

此时，应该清楚的是，您无法选择应用 Mean Shift 后获得多少“颜色”。那么，让我们展示如何做到这一点，因为这是您问题的第二部分。

您需要能够提前设置输出簇的数量，类似于K均值聚类 http://en.wikipedia.org/wiki/K-means_clustering.

它以这种方式为你的矩阵运行：

b = ClusteringComponents[a, 3]

{{1, 1, 1, 1, 1, 1, 1, 1}, 
 {1, 2, 2, 3, 2, 3, 3, 1}, 
 {1, 3, 3, 3, 3, 3, 3, 1}, 
 {1, 3, 2, 1, 1, 3, 3, 1}, 
 {1, 3, 3, 1, 1, 2, 3, 1}, 
 {1, 3, 3, 2, 3, 3, 3, 1}, 
 {1, 3, 3, 2, 2, 3, 3, 1}, 
 {1, 1, 1, 1, 1, 1, 1, 1}}

Or:

这与我们之前的结果非常相似，但正如您所看到的，现在我们只有三个输出级别。

HTH!

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Algorithm

image

imageprocessing

imagesegmentation

使用 Mean Shift 进行图像分割的解释的相关文章

实施二分查找有哪些陷阱？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案二分查找比看起来更难实现虽然二分搜索的基本思想相对简单但细节可能出人意料地棘手 Donald Knuth 新的二分搜索实现中最有可
Java递归方法求阶乘返回负输出[重复]

这个问题在这里已经有答案了我知道这是溢出但问题是 20 是相对较小的数字这不应该发生对吧有没有更好的方法来查找大数例如 1000 的阶乘而不会得到这种奇怪的结果 public class RecursiveFunctionsE
在java中使用BUBBLE SORT对二维字符串数组进行排序

类似的问题已经被问过但从来没有关于二维字符串数组因此在尝试了很长时间之后我找不到我想要的我正在尝试使用 BubbleSort 对 java 中的 2D 字符串数组进行排序作为输入我收到一个二维字符串数组一个表以及您应该排序的
如何用约束标记一大组“传递群”？

在 NealB解决方案之后进行编辑与以下解决方案相比 NealB的解决方案非常非常快任何另一个 https stackoverflow com q 18033115 answers and 提出了关于添加约束以提高性能的新问题 Nea
Java-如何将黑白图像加载到二进制中？

我在 FSE 模式下使用 Java 和 swing 我想将完全黑白图像加载为二进制格式最好是二维数组并将其用于基于掩码的每像素碰撞检测我什至不知道从哪里开始过去一个小时我一直在研究但没有找到任何相关的东西只需将其读入Buffer
有没有时间复杂度为O(N)的排序算法？

大多数排序算法的复杂度为 O NN 或 O NlogN 来实现结果但是对于特定的输入集有些算法的复杂度为 O N 我想知道是否有一种排序算法在所有情况下都具有 O N 的复杂度如果您只能比较检查两个项目是否为正在排序的值那么您
需要解释搜索最小大和的算法

我正在解决 Codility 问题作为练习但无法回答其中一个问题我在互联网上找到了答案但我不明白这个算法是如何工作的有人可以引导我逐步完成它吗这是问题 You are given integers K M and a non em
加载位图图像至特定尺寸

我正在尝试使用 allegro 将位图加载到特定大小 al crate bitmap x y 创建特定大小的位图 al load bitmap filename 加载我需要的图像但为其原始大小我需要将位图加载到我设置的大小有任何想法吗
将图像编码为base64有什么效果？

如果我将图像 jpg 或 png 转换为 base64 那么它会更大还是具有相同的大小会大多少呢是否建议在我的网站上使用 Base64 编码的图像大约会大 37 非常粗略地说 Base64 编码的二进制数据的最终大小等于原始数据大小
使用 mongoose 通过 React 应用程序将图像上传到 mongodb 数据库

我正在为找到的对象创建一个反应应用程序我想允许用户上传这些对象的照片我尝试使用 axios 通过 post 请求将图像发送到猫鼬服务器但它不起作用这就是我如何将图像存储在带有预览的 React 组件中 handleImage eve
Prim 的迷宫生成算法：获取相邻单元格

我基于 Prim 算法编写了一个迷宫生成器程序该算法是 Prim 算法的随机版本从充满墙壁的网格开始选择一个单元格将其标记为迷宫的一部分将单元格的墙壁添加到墙壁列表中 While there are walls in the li
jpegtran 优化而不更改文件名

我需要优化一些图像但不更改它们的名称 jpegtran copy none optimize image jpg gt image jpg 但是这似乎创建了 0 的文件大小当我对不同的文件名执行此操作时大小仍然完全相同怎么样 jp
图像梯度角计算

我实际上是按照论文的说明进行操作的输入应该是二进制边缘图像输出应该是一个新图像并根据论文中的说明进行了修改我对指令的理解是获取边缘图像的梯度图像并对其进行修改并使用修改后的梯度创建一个新图像因此在 MATLAB Open
生产代码中的 LRU 实现

我有一些 C 代码需要使用 LRU 技术实现缓存替换目前我知道两种实现LRU缓存替换的方法每次访问缓存数据时使用时间戳最后比较替换时的时间戳使用缓存项的堆栈如果最近访问过它们则将它们移动到顶部因此最后底部将包含 LRU 候选
列出所有 k 元组，其条目总和为 n，忽略旋转

有没有一种有效的算法来查找所有序列k总和为的非负整数n 同时避免旋转如果可能的话完全避免顺序很重要但对于我正在解决的问题来说轮换是多余的例如与k 3 和n 3 我想要得到一个如下所示的列表 3 0 0 2 1 0 2 0 1
应用对数来导航树

我曾经知道一种使用对数从树的一片叶子移动到树的下一个有序叶子的方法我认为它涉及获取当前叶子的位置值排名并将其用作从根向下到新目标叶子的新遍历的种子一直使用对数函数测试来确定是否沿着右或左节点向下到达叶子我已经不记得如何运用
AStar-名称解释

我正在寻找 AStar A 算法为何被称为 AStar 的解释所有类似的最短路径问题算法通常都以其开发者的名字命名那么 AStar 代表什么有称为 A1 和 A2 的算法后来证明A2是最优的实际上也是可能的最好算法所以他给它
如何在Django中显示内存中的图片？

我知道如何将图片显示为内存中的页面如下所示 import cStringIO mStream cStringIO StringIO picBin return HttpResponse mStream getvalue image jpg
如何从 Trie 中检索给定长度的随机单词

我有一个简单的 Trie 用来存储大约 80k 长度为 2 15 的单词它非常适合检查字符串是否是单词但是现在我需要一种获取给定长度的随机单词的方法换句话说我需要 getRandomWord 5 来返回 5 个字母的单词所有 5
如何加载图像文件到ImageView？

我试图在从文件选择器中选择图像文件后立即显示该图像文件文件选择器仅限于 png 和 jpg 文件所选文件存储在文件类型的变量中为此我设置了一个 ImageView 我希望用这个新文件设置图像唯一的问题是它的类型是文件而不是图像如

随机推荐

如何将层次结构或多索引应用于 pandas 列

我看过很多关于如何分层排列数据帧行索引的示例但我试图对列执行相同的操作但不理解语法 Given df pd DataFrame np random randn 10 10 columns consumption voltage cons
哪些类型的语言允许以编程方式创建变量名称？

这个问题纯粹出于求知欲在相对频繁地浏览 Python 部分后我看到了许多类似的问题this https stackoverflow com questions 1429814 how to programmatically set a
单步执行 IPython 中的函数

有没有办法进入 ipython 中函数的第一行我想象的东西会是这样的 step foo 1 2 运行的ipdb并在第一行设置断点foo 如果我现在想这样做我必须转到该函数的源代码并添加一个import ipdb ipdb set tra
std::initializer_list<> 和参考参数

我是使用初始化列表的新手我想知道它们是否与其他 stl 容器类似我的意思是他们复制值吗我想做的是一个简单的 min 函数如下所示 template
如何插入显式值和从另一个表检索的数据的混合

我知道两种将数据插入表的方法方法1 显式值 INSERT INTO table field1 field2 field3 VALUES value1 value2 value3 方法2 从另一个表复制数据 INSERT INTO tabl
IDLE 无法导入 Tkinter。您的 Python 可能未配置 Tk [重复]

这个问题在这里已经有答案了我运行的是 Ubuntu 10 10 今天安装了 Python 3 2 系统已经运行Python 2 6 我在终端中输入idle3 2 它给了我 IDLE 无法导入 Tkinter 您的 Python 可能未针对
Ruby on Rails Devise Oauth-facebook OmniAuth::Strategies::OAuth2::CallbackError

我使用 facebook 实现 oauth 登录并设计当从接受应用程序弹出窗口返回时我收到以下错误由于检测到 Csrf 无法通过 Facebook 验证您的身份这是日志于 2014 01 23 23 59 58 0100 开
是否可以使用 C/C++ 构建企业应用程序？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
自定义光标，无需库即可拖放 HTML 元素

I have an HTML page which has some draggable elements Our specs say that hovering mouse on such element the cursor must
Xcode 6 Beta / Swift - Playground 未更新

我正在玩 Xcode 6 第一个测试版的 Playground 功能我注意到 Playground 有一半时间没有更新只是不显示结果计算或发生了多少次循环迭代简单的代码循环函数都在那里甚至是 Swift Tourhttps de
Android 中通过 OpenMAX 访问相机

我目前正在尝试弄清楚如何在 Android 4 0 中通过 OpenMAX 访问相机该文档对我来说还不够所以我目前正在努力解决如何检索正确的问题XADataSource对于以下调用 engine gt CreateMediaRecord
获取 XML 节点下 xml 元素的数量

我希望获取 XML 文件中特定节点下的元素计数该文件将如下所示
使 Jupyter Notebook 中的单元格输出水平滚动？

I have a long Sympy expression that I d like to get printed with a horizontal scrollbar beneath it Is it possible to do
如何在使用 OR 运算符时使用高级 where 子句

我将如何生成一个查询显示 user id 1 谁是俱乐部成员主题是足球网球或板球 id user id member football tennis cricket 1 1 Yes 1 NULL NULL 2 1 Yes NULL N
谷歌地图搜索框在地图外面

我正在使用 Google Maps API 并且插入了一个具有自动完成功能的搜索表单问题是输入框卡在地图中我无法将其显示在地图之外 div style margin top 100px background 00a6d6 width 1
如何将切片器值设置为Power BI中第一个可用值表单表？

我要求切片器中所选的值必须有效让我们假设如果我在商店切片器中选择一个值并且该商店将从公司中删除切片器仍将显示其名称但与切片器交互的视觉效果中没有数据选择默认值手动更新切片器值但我只想在我的商店切片器中选择相关商店我知道它的切
如何在 APNS 中发布推送通知以及如何在 iPhone 中显示通知？

我对 APNS 有几个疑问我正在尝试澄清 APNS 但仍需要一些澄清我必须知道how we are posting push notification in APN Server and how we push the notifica
使用 Highcharts 和 React 创建条形图 - 出现未找到渲染 div 的错误

我正在尝试在我的 Web 应用程序中使用 Highcharts 创建条形图该应用程序在前端使用 React 下面是我的仪表板 tsx 文件的片段我基本上只是从 JSFiddle 复制并粘贴了代码 http jsfiddle net 8q
为什么 for_each + lambda 会触发 -Waggregate-return 警告？

当尝试使用 gcc 和以下示例时 Waggregate return标记警告 function call has aggregate value触发器 struct Element stuff Container
使用 Mean Shift 进行图像分割的解释

谁能帮我理解 Mean Shift 分割的实际工作原理吗这是我刚刚制作的一个 8x8 矩阵 103 103 103 103 103 103 106 104 103 147 147 153 147 156 153 104 107 153 1

使用 Mean Shift 进行图像分割的解释

使用 Mean Shift 进行图像分割的解释 的相关文章

随机推荐

热门标签

使用 Mean Shift 进行图像分割的解释的相关文章