图像二值化方法--OTSU（最大类间方差法）

2023-11-09

最大类间方差法（OTSU）是找到自适应阈值的常用方法。原理参考了冈萨雷斯的《数字图像处理》。

以下是自己写的函数：

//----获取灰度图in的OTSU阈值--
int Segment::otsuMat(Mat in)
{
	int i,j;
	int temp;
	//第一类均值，第二类均值，全局均值，mk=p1*m1, 第一类概率，第二类概率
	double m1,m2,mG,mk,p1,p2;

	int hist[256] = {0};
	double pro_hist[256] = {0.0};

	double cov;
	double maxcov=0.0;
	int maxthread=0;

	int row = in.rows;
	int col = in.cols;

	//统计每个灰度的数量
	for(i=0; i<row; ++i) {
		for(j=0; j<col; ++j) {
			temp = in.at<uchar>(i,j);
			hist[temp]++;
		}
	}

	//计算每个灰度级占图像的概率
	for(i=0; i<256; ++i)
		pro_hist[i] = (double)hist[i]/(double)(row*col);

	//计算平均灰度值
	mG = 0.0;
	for(i=0; i<256; ++i)
		mG += i * pro_hist[i];

	//统计前景和背景的平均灰度值，并计算类间方差
	for(i=0; i<256; ++i)
	{
		m1=0.0; m2=0.0; mk=0.0; p1=0.0; p2=0.0;
		for(j=0; j<i; ++j) {
			p1 += pro_hist[j];
			mk += j*pro_hist[j];
		}

		m1 = mk/p1;  //mk=p1*m1,是一个中间值

		p2 = 1 - p1;  //p1+p2=1;
		m2 = (mG - mk)/p2;  //mG=p1*m1+p2*m2;

		//计算类间方差
		cov = p1*p2*(m1-m2)*(m1-m2);
		if(cov>maxcov) {
			maxcov = cov;
			maxthread = i;
		}
	}
	//cout<<maxthread<<endl;
	return maxthread;

}

每次需要的时候就直接复制粘贴，效果常常很满意，就感觉要二值化OTSU法总可以用上，但是今天发现不好用了。我需要把一组图片分离出目标和背景，选取了Lab空间中的L通道，直接使用OTSU法。本来这一组图背景很相似，但是结果发现分割后有一些图片错误太明显。查看了阈值，发现相差蛮多的。例如下面的四张图。

灰度图：

对应的二值图：

图1,2,4的结果都可以接受，但是图3的结果突然就差了很远，即使我在OTSU法算得的阈值基础上加加减减也没办法兼顾到每一张图。

我列出了灰度图的均值和方差，以及OTSU算得的阈值

这四张图的均值和方差很接近，但是OTSU算得的阈值却变化较大，尤其是图3，导致二值化结果不正确。

觉得自己对“最大类间方差”理解有误，至少，它不能解决这一类问题。它的结果 out of my control. 琢磨琢磨，到底是怎么回事？

最后通过均值和标准差设置了阈值，效果可控。

另外，要使用OTSU，也可以直接采用opencv 库函数：

double threshold(InputArray src, OutputArray dst, double thresh, double maxval, int type)

当 type = CV_THRESH_OTSU 时, thresh 的值会被忽略，所以可以任取一个值。

在手册上，type 中没有列出OTSU方法，但是在函数源代码中是有的：

double cv::threshold( InputArray _src, OutputArray _dst, double thresh, double maxval, int type )
{
    Mat src = _src.getMat();
    bool use_otsu = (type & THRESH_OTSU) != 0;
    type &= THRESH_MASK;

    if( use_otsu )
    {
        CV_Assert( src.type() == CV_8UC1 );
        thresh = getThreshVal_Otsu_8u(src);
    }

    _dst.create( src.size(), src.type() );
    Mat dst = _dst.getMat();

    if( src.depth() == CV_8U )
    {
        int ithresh = cvFloor(thresh);
        thresh = ithresh;
        int imaxval = cvRound(maxval);
        if( type == THRESH_TRUNC )
            imaxval = ithresh;
        imaxval = saturate_cast<uchar>(imaxval);

        if( ithresh < 0 || ithresh >= 255 )
        {
            if( type == THRESH_BINARY || type == THRESH_BINARY_INV ||
                ((type == THRESH_TRUNC || type == THRESH_TOZERO_INV) && ithresh < 0) ||
                (type == THRESH_TOZERO && ithresh >= 255) )
            {
                int v = type == THRESH_BINARY ? (ithresh >= 255 ? 0 : imaxval) :
                        type == THRESH_BINARY_INV ? (ithresh >= 255 ? imaxval : 0) :
                        /*type == THRESH_TRUNC ? imaxval :*/ 0;
                dst.setTo(v);
            }
            else
                src.copyTo(dst);
            return thresh;
        }
        thresh = ithresh;
        maxval = imaxval;
    }
    else if( src.depth() == CV_16S )
    {
        int ithresh = cvFloor(thresh);
        thresh = ithresh;
        int imaxval = cvRound(maxval);
        if( type == THRESH_TRUNC )
            imaxval = ithresh;
        imaxval = saturate_cast<short>(imaxval);

        if( ithresh < SHRT_MIN || ithresh >= SHRT_MAX )
        {
            if( type == THRESH_BINARY || type == THRESH_BINARY_INV ||
               ((type == THRESH_TRUNC || type == THRESH_TOZERO_INV) && ithresh < SHRT_MIN) ||
               (type == THRESH_TOZERO && ithresh >= SHRT_MAX) )
            {
                int v = type == THRESH_BINARY ? (ithresh >= SHRT_MAX ? 0 : imaxval) :
                type == THRESH_BINARY_INV ? (ithresh >= SHRT_MAX ? imaxval : 0) :
                /*type == THRESH_TRUNC ? imaxval :*/ 0;
                dst.setTo(v);
            }
            else
                src.copyTo(dst);
            return thresh;
        }
        thresh = ithresh;
        maxval = imaxval;
    }
    else if( src.depth() == CV_32F )
        ;
    else
        CV_Error( CV_StsUnsupportedFormat, "" );

    parallel_for_(Range(0, dst.rows),
                  ThresholdRunner(src, dst, thresh, maxval, type),
                  dst.total()/(double)(1<<16));
    return thresh;
}

其中 type 取值：

/* Threshold types */
enum
{
    CV_THRESH_BINARY      =0,  /* value = value > threshold ? max_value : 0       */
    CV_THRESH_BINARY_INV  =1,  /* value = value > threshold ? 0 : max_value       */
    CV_THRESH_TRUNC       =2,  /* value = value > threshold ? threshold : value   */
    CV_THRESH_TOZERO      =3,  /* value = value > threshold ? value : 0           */
    CV_THRESH_TOZERO_INV  =4,  /* value = value > threshold ? 0 : value           */
    CV_THRESH_MASK        =7,
    CV_THRESH_OTSU        =8  /* use Otsu algorithm to choose the optimal threshold value;
                                 combine the flag with one of the above CV_THRESH_* values */
};

其中 getThreshVal_Otsu_8u():

static double
getThreshVal_Otsu_8u( const Mat& _src )
{
    Size size = _src.size();
    if( _src.isContinuous() )
    {
        size.width *= size.height;
        size.height = 1;
    }
    const int N = 256;
    int i, j, h[N] = {0};
    for( i = 0; i < size.height; i++ )
    {
        const uchar* src = _src.data + _src.step*i;
        j = 0;
        #if CV_ENABLE_UNROLLED
        for( ; j <= size.width - 4; j += 4 )
        {
            int v0 = src[j], v1 = src[j+1];
            h[v0]++; h[v1]++;
            v0 = src[j+2]; v1 = src[j+3];
            h[v0]++; h[v1]++;
        }
        #endif
        for( ; j < size.width; j++ )
            h[src[j]]++;
    }

    double mu = 0, scale = 1./(size.width*size.height);
    for( i = 0; i < N; i++ )
        mu += i*(double)h[i];

    mu *= scale;
    double mu1 = 0, q1 = 0;
    double max_sigma = 0, max_val = 0;

    for( i = 0; i < N; i++ )
    {
        double p_i, q2, mu2, sigma;

        p_i = h[i]*scale;
        mu1 *= q1;
        q1 += p_i;
        q2 = 1. - q1;

        if( std::min(q1,q2) < FLT_EPSILON || std::max(q1,q2) > 1. - FLT_EPSILON )
            continue;

        mu1 = (mu1 + i*p_i)/q1;
        mu2 = (mu - q1*mu1)/q2;
        sigma = q1*q2*(mu1 - mu2)*(mu1 - mu2);
        if( sigma > max_sigma )
        {
            max_sigma = sigma;
            max_val = i;
        }
    }

    return max_val;
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

opencv

c

二值化

阈值

otsu

图像二值化方法--OTSU（最大类间方差法）的相关文章

asp.net 文本框文本模式数字，仅允许数字

我只是想知道 ASP NET 中是否有一种方法只允许文本框中的数字textmode number 当我使用这个时
在搜索 List 时，为什么 Enumerable.Any(Func predicate) 比带有 if 语句的 foreach 慢

最近有件事引起了我的好奇心 Why is the Enumerable Any Func
迭代变量并查找特定类型实例的技术

我想迭代进程中内存中的变量通过插件动态加载并查找特定类型的实例以前我可以找到特定类型或内存中的所有类型我可以创建类型的实例我可以获取作为不同类型的字段包含的实例但我无论如何都不知道只是搜索特定类型的实例一种方法是使用 W
为什么我不能用 `= delete;` 声明纯虚函数？

Intro 纯虚函数使用通用语法声明 virtual f 0 然而自 c 11 以来有一种方法可以显式地传达non existence 特殊成员函数的 Mystruct delete eg default constructor Q
为什么大多数 C 开发人员使用 Define 而不是 const？ [复制]

这个问题在这里已经有答案了在许多程序中 define与常量具有相同的用途例如 define FIELD WIDTH 10 const int fieldWidth 10 我通常认为第一种形式优于另一种形式它依赖于预处理器来处理基本上是
向 ExpandoObject 添加方法时，“关键字 'this' 在静态属性、静态方法或静态字段初始值设定项中无效”

我尝试向 ExpandoObject 添加一个动态方法该方法将返回属性动态添加给它但它总是给我错误我在这里做错了什么吗 using System using System Collections Generic using Sys
C# 中的接口继承

我试图解决我在编写应用程序时遇到的相当大的对我来说问题请看这个为了简单起见我将尝试缩短代码我有一个名为的根接口IRepository
Clang 编译器 (x86)：80 位长双精度

我正在尝试在 x86 Windows 平台上使用本机 80 位长双精度海湾合作委员会选项 mlong double 80 https gcc gnu org onlinedocs gcc x86 Options html似乎不适用于 cl
构造函数中显式关键字的使用

我试图了解 C 中显式关键字的用法并查看了这个问题C 中的explicit关键字是什么意思 https stackoverflow com questions 121162 但是那里列出的示例实际上是前两个答案对于用法并不是很清楚
JSON 数组到 C# 列表

如何将这个简单的 JSON 字符串反序列化为 C 中的列表 on4ThnU7 n71YZYVKD CVfSpM2W 10kQotV 这样 List
如何配置 WebService 返回 ArrayList 而不是 Array？

我有一个在 jax ws 上实现的 java Web 服务此 Web 服务返回用户的通用列表它运行得很好 Stateless name AdminToolSessionEJB RemoteBinding jndiBinding Admi
如何将“外部模板”与由同一类中的模板化成员使用的嵌套类一起使用？

首先一些背景信息我尝试以 Herb Sutter 在他的解决方案中介绍的方式使用 Pimpl 习语得到了 101 http herbsutter com gotw 101 这在头文件中看起来像这样 include pimpl h h
将数据打印到文件

我已经超载了 lt lt 运算符使其写入文件并写入控制台我已经为同一个函数创建了 8 个线程并且我想输出 hello hi 如果我在无限循环中运行这个线程例程文件中的o p是 hello hi hello hi hello hi e
如何重置捕获像素的值

我正在尝试创建一个 C 函数该函数返回屏幕截图位图中每四个像素的 R G 和 B 值这是我的代码的一部分 for int ix 4 ix lt 1366 ix ix 4 x x 4 for int iy 3 iy lt 768 iy i
当模板类不包含可用的成员函数时，如何在编译时验证模板参数？

我有以下模板struct template
当我“绘制”线条时，如何将点平均分配到 LineRenderer 的宽度曲线？

我正在使用线条渲染器创建一个绘图应用程序现在我尝试使用线条渲染器上的宽度曲线启用笔压问题在于 AnimationCurve 的时间值水平轴从 0 标准化为 1 因此我不能在每次添加位置时都在其末尾添加一个值除非有一个我不知
获取 2 个数据集 c# 中的差异

我正在编写一个简短的算法它必须比较两个数据集以便可以进一步处理两者之间的差异我尝试通过合并这两个数据集并将结果更改放入新的数据集来实现此目标我的方法如下所示 private DataSet ComputateDiff DataSet
将代码拆分为标头/源文件

我从 Asio 的示例页面中获取了以下代码 class tcp connection public boost enable shared from this
带重定向标准流的 C# + telnet 进程立即退出

我正在尝试用 C 做一个脚本化 telnet 项目有点类似于Tcl期望 http expect nist gov 我需要为其启动 telnet 进程并重定向和处理其 stdin stdout 流问题是生成的 telnet 进程在
错误：无效使用不完整类型“类 Move”/未定义对 Move::NONE 的引用

拜托我不知道为什么这个简单的代码被拒绝它给了我 2 个编译错误请帮帮我 I use 代码块 20 03 我的编译器是GNU GCC 移动 hpp class Move public Move Move int int public

随机推荐

MySQL中length函数(刷SQL题时学到的)

查找字符串中逗号出现的次数牛客题霸牛客网 3 查询某个字符出现几次 length str1 length replace str1 str2
EditText输入内容拦截和监听删除

系列文章目录文章目录系列文章目录前言拦截输入内容提交监听软件盘删除按钮点击事件监听输入框文字粘贴复制全选等 code 前言有时候我们会有一些特殊的需求需要对输入框进行特殊的处理比如对输入内容去除特殊字符操作或拦截输
statsmodels.tsa.stattools.adfuller 的用法

statsmodels tsa stattools adfuller x maxlag None regression c autolag AIC store False regresults False source 增广Dickey F
Linux下vi命令编辑器，编辑，保存和退出

1 vi 文件名 vi后面有空格接着按回车即可打开对应的文件如果没有对应的文件那么vi命令就会自动创建一个新的 2 vi打开文件后是命令模式状态要用i或者a命令或Insert键才可进入可编辑的状态最下面会出现 INSERT 3 保
python 列表操作方法详解及例子

原文链接 https www cnblogs com wj 1314 p 8433116 html 列表是Python中最基本的数据结构列表是最常用的Python数据类型列表是一个数据的集合集合内可以放任何数据类型可对集合方便的增删
云服务器安装操作系统后如何连接,服务器如何安装操作系统

服务器如何安装操作系统内容精选换一换如果您需要使用毕昇编译器则需要先在服务端安装毕昇编译器毕昇编译器基于开源LLVM开发并进行了优化和改进同时将flang作为默认的Fortran语言前端编译器是针对鲲鹏平台的高性能编译器当
华为OD机考-模拟消息队列（C，python）

题目描述让我们来模拟一个消息队列的运作有一个发布者和若干消费者发布者会在给定的时刻向消息队列发送消息若此时消息队列有消费者订阅这个消息会被发送到订阅的消费者中优先级最高输入中消费者按优先级升序排列的一个若此时没有订阅的消费者
urldecode 报错 Malformed UTF-8 characters, possibly incorrectly encoded

使用urlencode 编码了一段字符串写入数据库读取的时候使用urldecode 解码报错 Malformed UTF 8 characters possibly incorrectly encoded 解决方案检查一下是否保存到数据
ajax不弹出新页面问题

ajax默认是异步请求做局部刷新的指的是当前页数据渲染的如果后台是转发或者重定向了如果用ajax的话是不会弹出新的页面的 from提交的话如果后台是转发或者重定向了是可以打开新的页面的
【人脸识别】【python】Object arrays cannot be loaded when allow_pickle=False解决方案

2020年2月11日 0次阅读共1625个字 0条评论 0人点赞 QueenDekimZ mtcnn debug 用mtcnn对LFW人脸数据集进行人脸检测与关键点对齐并裁剪到160 160维为后续facenet训练作training
wx.login wx.getUserProfile 获取登录凭证

wx login 调用接口获取登录凭证 code 通过凭证进而换取用户登录态信息包括用户在当前小程序的唯一标识 openid 微信开放平台帐号下的唯一标识 unionid 若当前小程序已绑定到微信开放平台帐号及本次登录的会话密钥 ses
通过hexo快速搭建个人博客

个人博客预览点击这里菜卷的博客快速搭建一个博客一需要安装的工具二开始安装Hexo 三安装完成后初始化项目四在项目根目录下执行命令五启动项目六部署到github 七配置文件八安装next主题九优化next
C语言程序实训--实验设备管理系统

之前学校c语言程序实训课要求写的如果程序有错误或可以改进的地方希望各位指出开发环境 IDE Visual Studio Code Dev C 处理器 AMD Ryzen 7 PRO 6850HS with Radeon Graphic
73家！华为鸿蒙OS合作伙伴汇总

6月2日华为发布了最新版的鸿蒙操作系统 HarmonyOS 2 0 以及一系列搭载鸿蒙的硬件产品比如手机手表平板耳机显示器等等如今的智能终端越来越多厂商不可能为每个设备单独准备一个系统因为这不仅让开发者工作量倍增消费者用
Flask网站中使用Keras时报错“Tensor Tensor(*) is not an element of this graph”

HyperLPR车牌识别程序本地中能进行正常识别但将其放到flask搭建的网站中进行识别不能运行并报错 Tensor Tensor is not an element of this graph HyperLPR中的识别模型采用的是K
Mask掩码

Python中Mask的用法引例 Numpy的MaskedArray模块小于或小于等于给定数值大于或大于等于给定数值在给定范围内超出给定范围在算术运算期间忽略NaN和或infinite值 All men are scu
Count Color

http poj org problem id 2777 Description Chosen Problem Solving and Program design as an optional course you are require
【QT】——布局

目录 1 在UI窗口中布局 2 API设置布局 2 1 QLayout 2 2 QHBoxLayout 2 3 QVBoxLayout 2 4 QGirdLayout 注意示例 Qt 窗口布局是指将多个子窗口按照某种排列方式将其全部展示到
Apifox—诠释国产接口管理工具新高度

揭开Apifox的神秘面纱曾经在对于接口管理和调试工作上大量的开发者往往会选择使用Swagger做接口文档管理用Postman做接口调试工具然而这样使用的痛处其实也不言而喻原本同一类型的工作却被放置在不同的软件工具上并且对于接口
图像二值化方法--OTSU（最大类间方差法）

前面学习了直方图双峰法图像二值化方法中的阈值法最大类间方差法 OTSU 是找到自适应阈值的常用方法原理参考了冈萨雷斯的数字图像处理以下是自己写的函数获取灰度图in的OTSU阈值 int Segment otsuMat Mat i

图像二值化方法--OTSU（最大类间方差法）

图像二值化方法--OTSU（最大类间方差法） 的相关文章

随机推荐

热门标签

图像二值化方法--OTSU（最大类间方差法）的相关文章