使用Python检测图像是彩色、灰度还是黑白

2024-01-17

我从 jpeg 格式的 PDF 文件中提取页面图像，我需要确定每个图像是否更灰度、彩色或黑白（具有容差因子）。

我找到了一些使用 PIL 进行颜色检测的方法（here https://stackoverflow.com/questions/2270874/image-color-detection-using-python and here https://stackoverflow.com/questions/14041562/python-pil-detect-if-an-image-is-completely-black-or-white）但我不知道如何回答这个简单的（视觉）问题：它是更多黑白、彩色还是灰度图像？

我更喜欢在这部分使用 Python 和 PIL，但如果有人有线索（或解决方案），我也可以使用 OpenCV。

我尝试了 Gepeto 的解决方案，它有很多误报，因为颜色大方差可能只是偶然相似。正确的方法是计算每个像素的方差。首先缩小图像，这样您就不必处理数百万像素。

默认情况下，该函数还使用平均颜色偏差调整，我发现这可以改善预测。这样做的一个副作用是，它还会检测单色但非灰度图像（通常是棕褐色调的东西，该模型在检测与灰度的较大偏差时似乎有点崩溃）。您可以通过对色带平均值进行阈值处理将它们与真实灰度分开。

我在包含 13,000 张摄影图像的测试集上运行了该方法，得到了 99.1% 的准确率和 92.5% 的召回率的分类结果。通过使用非线性偏差调整可能会进一步提高准确性（例如，颜色值必须在 0 到 255 之间）。也许查看中位数平方误差而不是 MSE 会更好地允许例如带有小彩色标记的灰度图像。

from PIL import Image, ImageStat
def detect_color_image(file, thumb_size=40, MSE_cutoff=22, adjust_color_bias=True):
    pil_img = Image.open(file)
    bands = pil_img.getbands()
    if bands == ('R','G','B') or bands== ('R','G','B','A'):
        thumb = pil_img.resize((thumb_size,thumb_size))
        SSE, bias = 0, [0,0,0]
        if adjust_color_bias:
            bias = ImageStat.Stat(thumb).mean[:3]
            bias = [b - sum(bias)/3 for b in bias ]
        for pixel in thumb.getdata():
            mu = sum(pixel)/3
            SSE += sum((pixel[i] - mu - bias[i])*(pixel[i] - mu - bias[i]) for i in [0,1,2])
        MSE = float(SSE)/(thumb_size*thumb_size)
        if MSE <= MSE_cutoff:
            print "grayscale\t",
        else:
            print "Color\t\t\t",
        print "( MSE=",MSE,")"
    elif len(bands)==1:
        print "Black and white", bands
    else:
        print "Don't know...", bands

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用Python检测图像是彩色、灰度还是黑白的相关文章

OpenCV Python 删除图像中的某些对象

我正在使用带有 opencv 和 numpy 的 python 来检测天文中的星星例如这个1 https i stack imgur com AKwEJ jpg图片使用模板匹配我可以用阈值检测星星单击 2 2 https i sta
使用 python 通过搜索端点从 Spotify API 获取曲目

因此我尝试使用 API 的搜索端点进行搜索从而从 Spotify API 获取曲目请参阅文档 https developer spotify com documentation web api reference search sea
Keras，如何获取每一层的输出？

我已经用 CNN 训练了一个二元分类模型这是我的代码 model Sequential model add Convolution2D nb filters kernel size 0 kernel size 1 border mode
01 无效令牌[重复]

这个问题在这里已经有答案了嘿学习 python3有一段时间了遇到字典和dictionary name get 方法并尝试获取随机键值问题 data data get key 1 它有效并且返回 1 但如果我使用data get ke
针对不同相机（RGB 和红外）的 StereoCalibrate

我在校准两个摄像头时遇到问题第一个是 RGB 第二个是红外它们有不同的分辨率我调整了大小并裁剪了更大的图像焦距等等例子 RGB 1920x1080 Infrared 512x424 如何相互校准它们我应该在stereoCalib
在 C# 中实例化 python 类

我已经用 python 编写了一个类我想通过 IronPython 将其包装到 net 程序集中并在 C 应用程序中实例化我已将该类迁移到 IronPython 创建了一个库程序集并引用了它现在我如何真正获得该类的实例该类看起来
如何通过 Python socket.send() 发送字符串以外的任何内容

我对 Python 编程非常陌生但出于必要我必须快速地将一些东西组合在一起我正在尝试通过 UDP 发送一些数据除了当我执行 socket send 时我必须以字符串形式输入数据之外一切都正常这是我的程序这样你就可以看到我在做
使用 Pandas 查找自滚动高点以来的周期数

我在 Pandas 中使用rolling max函数 http pandas pydata org pandas docs stable computation html moving rolling statistics moments
打印一个 Jupyter 单元中定义的所有变量

有没有一种更简单的方法来以漂亮的方式显示单个单元格中定义的所有变量的名称和值我现在做的方式是这样的但是当有30个或更多变量时我浪费了很多时间您可以使用whos http ipython readthedocs io en stable
出现意外的关键字参数“timeout”（Python 中的 google-cloud-storage）

使用 google cloud storage 的 Python 项目在本地运行良好但是当它从 App Engine 运行时会显示错误 Traceback most recent call last File opt python3 7
指定 Parquet 属性 pyspark

如何在 PySpark 中指定 Parquet 块大小和页面大小我到处搜索但找不到任何有关函数调用或导入库的文档根据火花用户档案 https mail archives apache org mod mbox spark user 2
如何创建指向指针数组的 Python ctypes 指针

我需要学习如何处理char 在下面的 C 方法中通过 Python ctypes 我通过使用调用其他只需要单个指针的方法做得很好create string buffer 但此方法需要一个指向指针数组的指针 ladybugConvertToM
如何使用 python-gnupg 加密大型数据集而不占用所有内存？

我的磁盘上有一个非常大的文本文件假设它是 1 GB 或更多还假设该文件中的数据有 n每 120 个字符一个字符我在用python gnupg https pythonhosted org python gnupg 对此文件进行加密由
从 subprocess.Popen 获取整个输出

我通过调用 subprocess Popen 得到了一个有点奇怪的结果我怀疑这与我对 Python 的陌生有很大关系 args cscript USERPROFILE tools jslint js USERPROFILE tools j
tweepy 流到 sqlite 数据库 - 语法错误[重复]

这个问题在这里已经有答案了可能的重复 tweepy 流到 sqlite 数据库语法无效 https stackoverflow com questions 9434205 tweepy stream to sqlite database
带有整数的 np.sqrt 和 where 条件返回错误结果

当我将 numpy sqrt 方法应用于带有 a 的整数数组时我得到了奇怪的结果where健康状况见下文对于整数 a np array 1 4 9 np sqrt a where a gt 5 Out 3 array 0 0 5 3
在没有numpy的情况下在python中分配变量NaN

大多数语言都有一个 NaN 常量您可以使用它为变量分配值 NaN python 可以在不使用 numpy 的情况下做到这一点吗是的使用math nan https docs python org 3 library math html
python IDLE shell 似乎无法正确处理一些转义

例如 b 退格键打印为四元在下面的示例中显示为但是 n 换行是可以的 gt gt gt print abc bd abc d gt gt gt print abc nd abc d 我在 Vista pro python 2 7 下运行
Python 中的 C 指针算术

我正在尝试将一个简单的 C 程序转换为 Python 但由于我对 C 和 Python 都一无所知这对我来说很困难我被 C 指针困住了有一个函数采用 unsigned long int 指针并将其值添加到 while 循环中的某些变量
构建 OpenCV 时出错 :: MonitorFromRect 未在此范围内声明

我试图建立OpenCV version 2 4 8与它一起使用CodeBlocks and MinGw 我按照以下指示进行操作here http kevinhughes ca tutorials opencv install on wind

随机推荐

检查R中的值是否==整数（0）[重复]

这个问题在这里已经有答案了我正在使用grepR 中的函数检查是否满足条件正则表达式我所拥有的是这样的 grep expression string 一个例子可能是 value grep s A z value 哪个输出整数 0 我想要
具有绝对导入的 Rollup 和 Typescript 类型声明

我正在制作 React 组件库项目结构是这样的 src components utils hooks 现在我尝试使用汇总生成类型 d ts 文件类型是生成的但例如我的组件NumberInput正在使用绝对导入Input像这样的组件 i
React 与 ReactDOM？

我有点新的反应我发现我们必须导入两件事才能开始 React and ReactDOM 任何人都可以解释其中的区别我正在阅读反应文档 https reactjs org docs 但它没有说 React 和 ReactDOM 最近才被分成
C++ cout 不显示任何内容

什么可以解释为什么 cout 在此代码中没有显示任何内容我知道它与 v 0 1 行有关但我不知道为什么有人有解释吗编辑我也知道改变 v 0 1 对于 v push back 1 会解决问题 include
FreeTDS 不使用配置的 tds 版本

freetds v0 91 tds 版本不匹配我想在 Ubuntu 14 04 上连接到带有 FreeBSD 的 Windows SQL Server FreeTDS 使用 apt get 安装我使用以下命令尝试了不同的 tds 版本
iexpress 生成的可执行文件在 XP 上不是有效的 win32 应用程序

我使用的是 c windows syswow64 中的 32 位 iexpress exe 生成的 exe 文件在 Windows 7 和 Windows 8 x64 上运行良好我可以确认它是 32 位应用程序然而当尝试在 XP 上运
用C语言访问Gmail

python 有等效的吗libgmail http libgmail sourceforge net in C Edit 我正在努力实现相当于GmailFS http en wikipedia org wiki GmailFS在C 如果您能
使用knitr时无法让LyX生成不在同一行的两个图

这里是针织新手喜欢这个包一切都很顺利除了在 LyX 中编译后两个图不会并排出现不确定发生了什么因为我正在逐字复制 knitr 图形手册 knitr graphics lyx 中的示例我的 LyX 代码在图形浮动中 lt
Spring boot：排除一些自动配置的bean

我有一个使用 spring kafka 的 Spring boot 项目在这个项目中我构建了一些包装 spring kafka beans 的事件驱动组件即 KafkaTemplate 和 ConcurrentKafkaListene
如何通过.NET/C# 查找CPU 核心数？

有没有办法通过 NET C 找出CPU核心数 PS这是一个直接的代码问题而不是我应该使用多线程吗问题您可以获得与处理器相关的多种不同信息物理处理器数量核心数逻辑处理器的数量这些都可以不同如果机器具有 2 个支持超线程的双核
带有 angular2 的非 SPA

我开始使用 Angular2 带有 Express js 后端目的是将页面的几个部分的控制权传递给 Angular2 组件但我最终意识到当 Angular2 控制页面的整个区域时系统会更有效但是我的应用程序不是 SPA 除了保存
log4net 多个附加程序，写入事件查看器

我使用 log4net 进行日志记录我有两个附加程序一个文件和另一个事件日志附加程序我在注册表编辑器中注册了应用程序问题是现在两个记录器都在事件查看器中写入我需要fileAppender写入文件并eventLogAppender显
Cakephp find函数中限制sql

我如何在cakephp中的sql中使用限制我的意思是下面是sql select from emp limit 3 4 如何在 find 函数中使用上述限制 3 4 更好的方法 this gt Emp gt find all array l
VB6 子串索引

我正在尝试在 VB6 中匹配电子邮件地址字符串中的域名但这不是我的日常语言我基本上想从地址中提取域名即电子邮件受保护 cdn cgi l email protection 进行比较我想通过获取之后的所有内容来提取它我想找到的
R 中的 3d 曲面图

我正在寻找使用 Rplotly库来创建 x y z 坐标数据的 3D 曲面图类似于下面的链接所示 https plot ly r 3d surface plots https plot ly r 3d surface plots 看来pl
如何在每次显示视图控制器时随机化 UILabel 文本

如何在每次显示视图控制器时使 ViewController 中的标签具有不同的文本字符串谢谢我正在使用 Swift 3 假设您知道如何添加UILabel给你的ViewController 这里是如何在开始时选择随机文本的快速示例 cla
Haskell 中的自定义 concat (++) 运算符

是否可以定义我自己的 Haskell 中自定义数据类型的运算符 I have data MyType MyType String 我想将我自己的串联运算符定义为 instance MyType where MyType x MyType y
java.lang.IllegalArgumentException：指定的类型 [com.sun.faces.application.WebappLifecycleListener] 不是预期的侦听器类型之一

我遇到了以下问题我有一个使用 Java 8 和 tomcat 7 的应用程序现在我尝试转向 tomcat 8 我下载了一个开发环境 tomcat 8 二进制文件并开始在 eclipse 中工作我添加了一个新服务器 Apache tom
Android按钮动画与计时同步

我需要建议如何创建一些我想添加到按钮中的动画其实我有动画代码我需要的是如何正确设置每个动画的时间这是我已经尝试过的 fest setVisibility View INVISIBLE handler postDelayed new R
使用Python检测图像是彩色、灰度还是黑白

我从 jpeg 格式的 PDF 文件中提取页面图像我需要确定每个图像是否更灰度彩色或黑白具有容差因子我找到了一些使用 PIL 进行颜色检测的方法 here https stackoverflow com questions 2270

使用Python检测图像是彩色、灰度还是黑白

使用Python检测图像是彩色、灰度还是黑白 的相关文章

随机推荐

热门标签

使用Python检测图像是彩色、灰度还是黑白的相关文章