Opencv C++ 检测并裁剪图像上的白色区域

2024-06-18

我在网上搜索过，已经找到了一些方法来完成我想要的事情，但是与我需要的相比，这些方法的效率较低。

我有一个 kinect（使用 Microsoft SDK），当前正在获取一个移除背景的人，将结果保存在 3 通道 Mat 中，并将该人从背景中移除。现在我需要裁剪图像以仅适合该人，忽略黑色区域。

这是棘手的部分：我没有太多时间浪费在每个操作上（我还需要执行其他几个操作，这应该实时工作。我目前实现的是一个轮廓查找器，它只给出这个区域，但实时速度确实很慢。由于我只检测到一个白色区域，并且该区域非常大（图像区域的 50%），我认为有一些更快的方法可以做到这一点，因为我只想要最小值和该白色区域的 x 和 y 的最大值以对其进行裁剪。

这是我目前的裁剪功能：

cv::Mat thresh_canny;
cv::vector<cv::vector<cv::Point> > contours;
cv::vector<cv::Vec4i> hierarchy;
cv::threshold(src, thresh_canny, 0, 255, 0);
cv::Canny(thresh_canny, thresh_canny, 20, 80, 3);
cv::findContours(thresh_canny, contours, hierarchy, CV_RETR_TREE, CV_CHAIN_APPROX_SIMPLE, cv::Point(0, 0));

if (contours.size() != 1)
    return false;

cv::Rect r = cv::boundingRect(contours.at(0));
src(r).copyTo(dst);
return true;

非常感谢！！

编辑：输入图像

如果您的图像没有非黑色异常值（如噪声），您可以忽略 canny 和 findContours，而只需从所有非黑色像素位置创建边界矩形：

int main()
{
cv::Mat in = cv::imread("CropWhite.jpg");

// vector with all non-black point positions
std::vector<cv::Point> nonBlackList;
nonBlackList.reserve(in.rows*in.cols);

// add all non-black points to the vector
//TODO: there are more efficient ways to iterate through the image
for(int j=0; j<in.rows; ++j)
    for(int i=0; i<in.cols; ++i)
    {
        // if not black: add to the list
        if(in.at<cv::Vec3b>(j,i) != cv::Vec3b(0,0,0))
        {
            nonBlackList.push_back(cv::Point(i,j));
        }
    }

// create bounding rect around those points
cv::Rect bb = cv::boundingRect(nonBlackList);

// display result and save it
cv::imshow("found rect", in(bb));
cv::imwrite("CropWhiteResult.png", in(bb));


cv::waitKey(-1);
return 0;
}

不知道openCV中是否有更有效的方法来创建向量，但这应该仍然比canny和findContours快得多。

使用此输入：

我得到这个结果：

轮廓周围有一些区域，因为您提供了 jpg 图像，我猜，由于压缩，轮廓的边框不是真正的黑色。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

opencv

crop

Detection

Opencv C++ 检测并裁剪图像上的白色区域的相关文章

插入多重集中：在该值第一次出现之前而不是最后一次出现之后

正如标题所示 multiset 在所有相同值的范围末尾插入一个值例如在多重集中插入 21 2 2 3做到了1 2 2 new 2 3 如何在所有相同值的范围开头插入新值例如在多重集中插入 21 2 2 3应该使1 new 2 2 2
VS2015 代码覆盖率不适用于 ASP.NET Core 1.0（以前称为 ASP.NET 5）中的测试

我有一个 ASP NET Core 1 0 以前称为 ASP NET 5 解决方案其中包含几个类库包和一个 ASP NET MVC6 项目我有一个使用支持 Core 1 0 的新 XUnit 2 0 的测试库然而由于某种原因当
为什么这个 IA32 汇编代码有 3 个 leaal 指令？

我编译了这个C函数 int calc int x int y int z return x 3 y 19 z 我在 calc s 中得到了这个我正在注释正在发生的事情 file calc c text globl calc type ca
动态库使用静态库，出现未定义的符号

我一直在寻找解决问题的方法只是得到了一些线索但我找不到任何一致的解决方案我有一个动态库 libdyna so 的代码它使用3个静态库 libone a libtwo a lib Three a 和log4cpp库的功能当我第一次构
在 C# 中格式化 Resharper 属性的支持字段

有没有办法控制 Resharper 放置其支持字段的位置目前它试图让他们在班级中名列前茅我希望他们能去到酒店的正上方还没有
asm、asm 易失性内存和破坏性内存之间的区别

在实现无锁数据结构和定时代码时通常需要抑制编译器的优化通常人们使用asm volatile with memory在 clobber 列表中但有时你会看到asm volatile或者只是一个简单的asm破坏记忆这些不同的语句对代码生
嵌套绑定表达式

这是一个后续问题我之前的问题 https stackoverflow com questions 2735294 templates function pointers and c0x include
资源文件中的控制字符 C#

我想添加Left To Right控制字符在resource resx文件输入Visual Studio 我在互联网上搜索并找到了一个名为在 NET 资源文件中转义序列的另一种方法 http www devx com tips Tip 34
如何防止函数中的隐式转换？

我正在编写一个实用程序类其中包含 IsEquals 和 IsGreaterThanEquals 等接受 double 类型参数的方法当我将浮点值发送到方法时它们会隐式转换为双精度值并进行比较我不希望这种事发生当我发送 float
使用 C 序列化 double 和 float

如何在 C 中序列化双精度数和浮点数我有以下用于序列化短整型整数和字符的代码 unsigned char serialize char unsigned char buffer char value buffer 0 value ret
改装和授权标头

目前我正在向我的请求添加授权标头如下所示文件 SomeFile cs public interface ITestApi Get api test id Task
从 pdf 和 word 文件中提取文本

如何在 C 中从 pdf 或 word 文件中提取文本删除粗体图像和其他富文本格式媒体您可以使用专为索引服务设计由索引服务使用的过滤器它们旨在从各种文档中提取纯文本这对于在文档内部进行搜索非常有用您可以将其用于 Office
如何使用 CMake 链接多个库

我有一些与 DCMTK 相关的代码如果我从命令行使用 g 我可以成功构建并运行它这是代码 include dcmtk config osconfig h include dcmtk dcmdata dctk h int main Dcm
值类型数组如何存储在 .NET 对象堆中？

在 NET中诸如int之类的值类型对象存储在内存中引用类型对象需要为引用和对象单独分配内存并且对象存储在 NET对象堆中而Array是在堆中创建的那么int 等值类型的数组如何存储在堆中呢这是否意味着值类型对象可以存储在堆中而无
清除指针向量[重复]

这个问题在这里已经有答案了假设我定义了一个这样的类 class foo private std vector lt int gt v public void bar1 for int i 0 i lt 10 i int a new int
静态成员函数中的封闭类的 C++ 类型

我认为这是完全不可能的但如果呢在任何版本的 C 中是否有可能以某种方式获取静态成员函数中封闭类的类型 class Impossible public static void Fun typedef Impossible Enclosi
设置了 OFN_ALLOWMULTISELECT 标志的 GetOpenFileName()

我正在尝试使用 GetOpenFileName 通用对话框调用来弹出打开对话框并允许用户选择多个文件我设置了 OFN ALLOWMULTISELECT 标志并设置了 OFN EXPLORER 因此我得到了新样式文件选择框当我设置
boost::bind 会导致开销吗？

我目前正在从事网络软件方面的工作它有一个主要类 server这显然代表一个服务器实例 A server实例可以发送请求并通过回调通知用户响应代码如下 class server public typedef boost function
如何在mvc视图中的表中显示数据库数据

在我的 MVC 应用程序中我从数据库检索数据我想在表格中显示退役数据控制器代码 public ActionResult MyAccount var user User Identity Name string sThumbnails
实现多个接口的 Service Fabric Actor 接口

我正在构建一个应用程序其中有多个不同的参与者类型这些参与者类型对于某些不同的数据对象具有相同类型的行为 CRUD 为了更轻松地创建处理此问题的代码我尝试创建一个这些参与者可以实现的接口这意味着我有一个看起来像这样的参与者界面 pub

随机推荐

使用函数和中点在 C++ 中对 Gusser 进行编号

我正在尝试使用函数编写数字猜测器的代码 playOneGame 函数的返回类型应为 void 它应该在 1 到 100 的范围内实现一个完整的猜谜游戏 shouldPlayAgain 函数应具有布尔返回类型它应该提示用户确定是否要再次玩
在 Jenkins Pipeline 的一个步骤中添加多个阶段

我正在尝试获得一个并行运行 2 个步骤的管道其中 YAML 如下所示 steps step Step1 stages stage Build steps build a build b build c stage Sniff steps
设置img src而不发出请求

作为构建复制和粘贴代码的一部分我们必须使用 dom 元素并将文本其他 dom 元素附加到其中最终结果将是要复制的代码但是当附加图像元素时浏览器always发出对图像 src 的请求有什么办法解决吗 i e var img d
如何在没有接口的情况下模拟多重继承？

如何在不使用接口的情况下在 C 中模拟多重继承我确实相信接口能力不适用于此任务我正在寻找更多面向设计模式的方式就像 Marcus 所说使用接口扩展方法来制作像 mixins 这样的东西可能是你目前最好的选择另请参阅使用接
在 bash 脚本中使用源时出现“源：未找到”错误

我正在尝试编写我认为的一个简单的 bash 脚本它将运行 virtualenv 以 1 美元创建一个新环境激活虚拟环境做更多的事情安装 django 将 django admin py 添加到 virtualenv 的路径等
Elastic Search 6 嵌套查询聚合

我是弹性搜索查询和聚合的新手我有一个带有以下映射的嵌套文档 PUT company mappings data properties deptId type keyword deptName type keyword employee t
如何更改ggplot2中x轴和y轴的位置

在我的真实研究世界中在顶部或顶部和底部显示 x 轴在右侧显示 y 轴是很常见的然而 ggplot2 中的默认位置是 x 位于底部 y 位于左侧下列的科斯克在这里发帖 https groups google com forum f
为除 admin 之外的所有用户禁用管理栏

我已经安装了 WordPress 和 BudyPress 我想禁用所有用户顶部显示的管理栏有人可以告诉我如何正确地做到这一点吗 function is current user administrator global current u
Xamarin Android：检测设备当前是否正在播放音频

在应用程序启动时是否可以检测设备的音频播放器或其他应用程序当前是否正在播放音乐您可以使用AudioManager http developer android com reference android media AudioManag
根据值匹配数组

我使用以下代码来解析 yaml 并应得到输出为runners对象和函数build应更改数据结构并根据以下结构提供输出 type Exec struct NameVal string Executer string 这是我尝试过的但我不知道
在 Visual Studio 2010 中使用自定义 UI 编辑器注册自定义文件类型

我发现旧文章叫做立即学习VSX和一部分 30 Visual Studio 中的自定义编辑器 http dotneteers net blogs divedeeper archive 2008 09 01 LearnVSXNowPart30
棋盘上骑士的最短路径

我一直在为即将到来的编程比赛进行练习我偶然发现了一个我完全困惑的问题然而我觉得这是一个我现在应该学习的概念而不是祈祷它永远不会出现基本上它涉及棋盘上的骑士棋子您将获得两个输入起始位置和结束位置目标是计算并打印骑士到达目标位
使用 Beautifulsoup 抓取多个网站

我想知道为什么列出all links and all titles不想接收列表中的任何记录titles and links 我也尝试过 extend 方法但没有帮助 import requests from bs4 import Beau
泛型和系统集合

迁移到 NET 2 0 后是否还有理由继续使用 systems Collections 命名空间除了维护遗留代码之外是否应该始终使用泛型命名空间在大多数情况下泛型集合的执行速度比非泛型集合更快并且为您带来强类型集合的好处比较
挂钩 jQuery 验证消息更改

我想在工具提示中显示 jQuery 验证消息为了实现这一目标我首先将以下 CSS 规则添加到我的样式表中 fieldset field validation error display none fieldset field valid
使用通配符分割字符串

我有一个变量字符串其中包含我需要的值和拆分器问题是字符串的长度是可变的分割器的类型也是可变的它们通过 XML 文件到达字符串将如下所示 1 20 51 2 name jpg 但也可以是 1 20 51 name jpg 坚实的因
如何使用 Clang 编译器和 CMake 进行分析

Question 1 What output我应该期待当我想使用进行分析时clang编译器 2 我该怎么办profiling for a C project它使用clang作为编译器andCMake 作为构建工具重新分析我所使用的内容 1
cellForRowAtIndexPath 中的框架没有变化

我想改变x位置框架view细胞内的cellForRowAtIndexPath对于某些条件我使用了以下代码但并不改变看法x position frame void viewDidLoad super viewDidLoad UINib n
Android WebView视频关闭全屏视图后，webview自动滚动

我在用WebView显示包含文本和视频内容的网页它按预期正确加载和显示视频但是当我进入视频的全屏视图时我按照给定的方式实现了全屏视频视图here https github com akhgupta WebviewVideo 然后回到W
Opencv C++ 检测并裁剪图像上的白色区域

我在网上搜索过已经找到了一些方法来完成我想要的事情但是与我需要的相比这些方法的效率较低我有一个 kinect 使用 Microsoft SDK 当前正在获取一个移除背景的人将结果保存在 3 通道 Mat 中并将该人从背景中移除

Opencv C++ 检测并裁剪图像上的白色区域

Opencv C++ 检测并裁剪图像上的白色区域 的相关文章

随机推荐

热门标签

Opencv C++ 检测并裁剪图像上的白色区域的相关文章