如何在opencv中仅提取nxn图像的3个特征向量？

2024-02-24

我正在尝试使用以下方法将 RGB 图像转换为灰度图像paper https://www.semanticscholar.org/paper/Novel-PCA-based-color-to-gray-image-conversion-Seo-Kim/7c23493d4cbe69c6eed697f6394d0f31c660e6ca/pdf.

论文中使用的主要算法是这样的：基于 PCA 的新颖算法将图像转换为灰度 https://i.stack.imgur.com/dTJIR.png

然而，当我尝试从图像中提取特征向量时，我得到了 500 个特征值，而不是所需的 3 个。据我所知，一个 NxN 矩阵通常给出 N 个特征向量，但我不太确定我应该在这里做什么才能只得到 3 个特征向量。

我应该做什么有什么帮助吗？到目前为止，这是我的代码：

import numpy as np
import cv2

def pca_rgb2gray(img):
    """
    NOVEL PCA-BASED COLOR-TO-GRAY IMAGE CONVERSION
    Authors:
    -Ja-Won Seo
    -Seong Dae Kim
    2013 IEEE International Conference on Image Processing
    """
    I_re = cv2.resize(img, (500,500))
    Iycc = cv2.cvtColor(I_re, cv2.COLOR_BGR2YCrCb)
    Izycc = Iycc - Iycc.mean()
    eigvals = []
    eigvecs = []
    final_im = []
    for i in range(3):
        res = np.linalg.eig(Izycc[:,:,i])
        eigvals.append(res[0])
        eigvecs.append(res[1])
    eignorm = np.linalg.norm(eigvals)
    for i in range(3):
        eigvals[i]/=eignorm
        eigvecs[i]/=np.linalg.norm(eigvecs[i])
        temp = eigvals[i] * np.dot(eigvecs[i], Izycc[:,:,i])
        final_im.append(temp)
    final_im = final_im[0] + final_im[1] + final_im[2]
    return final_im
if __name__ == '__main__':
    img = cv2.imread('image.png')
    gray = pca_rgb2gray(img)

The accepted answer by Ahmed unfortunately has the PCA math wrong, leading to the a result quite different to the manuscript. Here are the images screen captured from the manuscript.

均值居中和 SVD 应沿另一个维度进行，并将通道视为不同的样本。平均居中旨在获得零的平均像素响应，而不是零的平均通道响应。

链接的算法还清楚地表明，PCA 模型的投影首先涉及将图像乘以分数，然后将该乘积乘以特征值，而不是像其他答案中那样反过来。

有关数学的更多信息，请参阅我的PCA数学答案在这里 https://stats.stackexchange.com/questions/404731/eigenvalues-as-weighting-factors-for-projection-results-on-corresponding-eigenve/405999#405999

代码中的差异可以在输出中看到。由于手稿没有提供示例输出（我发现），因此结果之间可能存在细微差别，因为手稿是捕获的屏幕截图。

For comparison, the downloaded colour file, which is a little more contrasted than the screenshot, so one would expect the same from the output greyscale.

First the result from Ahmed's code:

Then the result from the updated code:

更正后的代码（基于艾哈迈德的代码，以便于比较）是

import numpy as np
import cv2
from numpy.linalg import svd, norm

# Read input image
Ibgr = cv2.imread('path/peppers.jpg')
#Convert to YCrCb
Iycc = cv2.cvtColor(Ibgr, cv2.COLOR_BGR2YCR_CB)

# Reshape the H by W by 3 array to a 3 by N array (N = W * H)
Izycc = Iycc.reshape([-1, 3]).T

# Remove mean along Y, Cr, and Cb *separately*!
Izycc = Izycc - Izycc.mean(0)  #(1)[:, np.newaxis]
# Mean across channels is required (separate means for each channel is not a 
# mathematically sensible idea) - each pixel's variation should centre around 0

# Make sure we're dealing with zero-mean data here: the mean for Y, Cr, and Cb
# should separately be zero. Recall: Izycc is 3 by N array. 
# Original assertion was based on a false presmise. Mean value for each pixel should be 0
assert(np.allclose(np.mean(Izycc, 0), 0.0))

# Compute data array's SVD. Ignore the 3rd return value: unimportant in this context. 
(U, S, L) = svd(Izycc, full_matrices=False)

# Square the data's singular vectors to get the eigenvalues. Then, normalize
# the three eigenvalues to unit norm and finally, make a diagonal matrix out of
# them. 
eigvals = np.diag(S**2 / norm(S**2))

# Eigenvectors are just the right-singular vectors.
eigvecs = U;

# Project the YCrCb data onto the principal components and reshape to W by H
# array.
# This was performed incorrectly, the published algorithm shows that the eigenvectors 
# are multiplied by the flattened image then scaled by eigenvalues
Igray = np.dot(eigvecs.T, np.dot(eigvals, Izycc)).sum(0).reshape(Iycc.shape[:2])
Igray2 = np.dot(eigvals, np.dot(eigvecs, Izycc)).sum(0).reshape(Iycc.shape[:2])
eigvals3 = eigvals*[1,-1,1]
Igray3 = np.dot(eigvals3, np.dot(eigvecs, Izycc)).sum(0).reshape(Iycc.shape[:2])
eigvals4 = eigvals*[1,-1,-1]
Igray4 = np.dot(eigvals4, np.dot(eigvecs, Izycc)).sum(0).reshape(Iycc.shape[:2])

# Rescale Igray to [0, 255]. This is a fancy way to do this.
from scipy.interpolate import interp1d
Igray = np.floor((interp1d([Igray.min(), Igray.max()],
                            [0.0, 256.0 - 1e-4]))(Igray))
Igray2 = np.floor((interp1d([Igray2.min(), Igray2.max()],
                            [0.0, 256.0 - 1e-4]))(Igray2))
Igray3 = np.floor((interp1d([Igray3.min(), Igray3.max()],
                            [0.0, 256.0 - 1e-4]))(Igray3))
Igray4 = np.floor((interp1d([Igray4.min(), Igray4.max()],
                            [0.0, 256.0 - 1e-4]))(Igray4))

# Make sure we don't accidentally produce a photographic negative (flip image
# intensities). N.B.: `norm` is often expensive; in real life, try to see if
# there's a more efficient way to do this.
if norm(Iycc[:,:,0] - Igray) > norm(Iycc[:,:,0] - (255.0 - Igray)):
    Igray = 255 - Igray
if norm(Iycc[:,:,0] - Igray2) > norm(Iycc[:,:,0] - (255.0 - Igray2)):
    Igray2 = 255 - Igray2
if norm(Iycc[:,:,0] - Igray3) > norm(Iycc[:,:,0] - (255.0 - Igray3)):
    Igray3 = 255 - Igray3
if norm(Iycc[:,:,0] - Igray4) > norm(Iycc[:,:,0] - (255.0 - Igray4)):
    Igray4 = 255 - Igray4

# Display result
if True:
    import pylab
    pylab.ion()
fGray =    pylab.imshow(Igray, cmap='gray')
# Save result
cv2.imwrite('peppers-gray.png', Igray.astype(np.uint8))

fGray2 = pylab.imshow(Igray2, cmap='gray')
# Save result
cv2.imwrite('peppers-gray2.png', Igray2.astype(np.uint8))

fGray3 =pylab.imshow(Igray3, cmap='gray')
# Save result
cv2.imwrite('peppers-gray3.png', Igray3.astype(np.uint8))

fGray4 =pylab.imshow(Igray4, cmap='gray')
# Save result
cv2.imwrite('peppers-gray4.png', Igray4.astype(np.uint8))

****编辑*****

根据 Nazlok 关于特征向量方向不稳定性的查询（任何一个特征向量的方向是任意的，因此不能保证不同的算法（或没有可重复的方向标准化步骤的单一算法）会给出相同的结果。我现在有添加了两个额外的示例，其中我只是交换了特征向量的符号（数字 2 以及数字 2 和 3）。结果又不同，仅 PC2 的切换给出了更轻的音调，而切换 2 和 3 则为类似（这并不奇怪，因为指数缩放将 PC3 的影响降到了很小）。我将把最后一个留给那些费心运行代码的人。

结论

如果没有采取明确的额外步骤来提供可重复和可再现的 PC 方向，该算法是不稳定的，我个人不愿意按原样使用它。纳兹洛克关于使用正负强度平衡的建议可以提供一条规则，但需要验证，因此超出了本答案的范围。然而，这样的规则并不能保证“最佳”解决方案，而只能保证稳定的解决方案。特征向量是单位向量，因此方差（强度的平方）是平衡的。零的哪一侧具有最大的幅值总和只是告诉我们哪一侧的各个像素贡献更大的方差，我怀疑这通常不是很有信息。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在opencv中仅提取nxn图像的3个特征向量？的相关文章

在 Pandas 中按日期获取有效合约

我在检测 pandas DataFrame 中的活动合约方面遇到了一些困难假设每一行都是一个协商对于每一行我有两列 initial date 和 end date 我想知道的是按日期划分的活跃合约数量到目前为止我做了一个非常低效的方
Django：如何测试“HttpResponsePermanentRedirect”

我正在为我的 django 应用程序编写一些测试在我看来它使用 HttpResponseRedirect 重定向到其他一些网址那么我该如何测试呢姜戈TestCase类有一个方法assertRedirects https docs d
如何在Python中循环并存储自变量中的值

我对 python 很陌生所以这听起来可能很愚蠢我进行了搜索但没有找到解决方案我在 python 中有一个名为 ExcRng 的函数我可以对该函数执行什么样的 for 循环以便将值存储在独立变量中我不想将它们存储在列表中而是
如何确定非阻塞套接字是否真正连接？

这个问题不仅限于Python 这是一个一般的套接字问题我有一个非阻塞套接字想要连接到一台可访问的机器在另一端该端口不存在为什么 select 仍然成功我预计会超时 sock send 因管道损坏而失败 select 之后如何确定
python - 是否可以扩展 xml-rpc 可以序列化的事物集？

我看到几个问题询问如何发送numpy ndarray通过 xml rpc 调用这不能开箱即用因为正如 xml rpc 中所述docs https docs python org 2 library xmlrpclib html 有一组固
从字符串到类型的词法转换

最近我尝试用Python存储和读取文件中的信息遇到了一个小问题我想从文本文件中读取类型信息从 string 到 int 或 float 的类型转换非常有效但从 string 到 type 的类型转换似乎是另一个问题当然我尝试了
在python中将文本文件解析为列表

我对 Python 完全陌生我正在尝试读取包含单词和数字组合的 txt 文件我可以很好地读取 txt 文件但我正在努力将字符串转换为我可以使用的格式 import matplotlib pyplot as plt import num
可以在 TensorFlow 中使用排名相关作为成本函数吗？

我正在处理偶尔充满异常值的极其嘈杂的数据因此我主要依靠相关性来衡量我的神经网络的准确性是否可以明确使用诸如等级相关性斯皮尔曼相关系数之类的东西作为我的成本函数到目前为止我主要依赖 MSE 作为相关性的代理我现在面临三个主要障碍
错误：permission_manager_qt.cpp(82) 不支持的权限类型：13

我正在开发具有内置浏览器功能的 python 代码 PyQt 5 13 import sys from PyQt5 QtCore import from PyQt5 QtGui import from PyQt5 QtWidgets imp
为什么 Python 中的“pip install”会引发语法错误？

我正在尝试使用 pip 安装软件包我试着跑pip install从Python shell 但我得到了SyntaxError 为什么我会收到此错误如何使用 pip 安装软件包 gt gt gt pip install selenium
sudo pip install python-Levenshtein 失败，错误代码 1

我正在尝试在 Linux 上安装 python Levenshtein 库但每当我尝试通过以下方式安装它时 sudo pip install python Levenshtein 我收到此错误命令 usr bin python c 导入
Python Kivy - 在本机网络浏览器中打开 url 的应用程序

我尝试制作一个简单的应用程序在单击 Screen One 上的按钮后在 Kivy 中打开一个网页我使用了这个主题 Python 在应用程序中直接显示网络浏览器 iframe https stackoverflow com questi
如何在python中检索aws批处理参数值？

流程 Dynamo DB gt Lambda gt 批处理如果将角色 arn 插入动态数据库它是从 lambda 事件中检索的然后使用submit job角色 arn 的 API 被传递为 parameters role arn ar
Django 在选择列表更改时创建毫无意义的迁移

我正在尝试使用可调用创建一个带有选择字段的模型以便 Django 在选择列表更改时不会创建迁移如中所述this https stackoverflow com questions 31788450 stop django from cr
Matplotlib Scatter - ValueError：RGBA 序列的长度应为 3 或 4

我正在尝试为我的功能绘制图表但不断收到此错误 ValueError RGBA sequence should have length 3 or 4 每当我只有 6 种形状时代码就可以完美运行但现在我将其增加到 10 种它就不起作用了
如何有效地从 loadmat 函数生成的嵌套 numpy 数组中提取值？

python中是否有更有效的方法从嵌套的python列表中提取数据例如A array array 12000000 dtype object 我一直在使用A 0 0 0 0 当你有很多像 A 这样的数据时这似乎不是一个有效的方法我也用
如何通过字符串匹配加速 pandas 行过滤？

我经常需要过滤 pandas 数据框df by df df col name string value 并且我想加快行选择操作有没有快速的方法可以做到这一点例如 In 1 df mul df 3000 2000 3 reset inde
如何禁止 celery 中的 pickle 序列化

Celery 默认使用 pickle 作为任务的序列化方法如中所述FAQ http ask github com celery faq html isn t using pickle a security concern 这代表一个安全漏
TypeError：无法使用抽象方法实例化抽象类 <...>

这是我的代码 from abc import ABC from abc import abstractmethod class Mamifiero ABC docstring for Mamifiero def init self self
异步和协程与任务队列

我一直在阅读有关 python 3 中的 asyncio 模块的内容以及更广泛地了解 python 中的协程的内容但我不明白是什么让 asyncio 成为如此出色的工具我的感觉是你可以用协程做的所有事情通过使用基于多处理模块例如

随机推荐

Flutter：没有为该类型定义 getter

我被页面路由困住了这是 main dart 中的代码 import package test routes router gr dart import package flutter material dart import packag
删除 Android 导航和顶部栏，

我正在尝试在已取得 root 权限的 Android 设备上实现 Kiosk 应用程序并且我需要完全禁用导航和状态栏这些命令在 adb shell 中工作禁用 service call activity 42 s16 com andr
获取android中已安装的应用程序列表

我正在尝试为 Android 开发一个应用程序启动器应用程序我刚开始但这里有一个问题如何获取 Android 中所有已安装应用程序的列表在您的活动中使用这些方法来获取已安装应用程序的列表 private ArrayList
为什么 JavaScript: new Date(year, Month, 0).getDate() 返回该月的天数？

我知道这个小小的 JavaScript 代码 var whatever new Date year month 0 getDate 返回特定年份的特定月份的天数但我似乎不明白其背后的逻辑在我们提到年份和月份之后那个零到底在做什么请解
Ruby on Rails 移动应用程序

我正在尝试开发一个 Ruby on Rails 应用程序它将检测客户端即连接到服务器的移动设备浏览器并呈现适当的布局我尝试使用以下链接但仍然无法连接有什么建议 http www arctickiwi com blog mobi
我如何在 spring security acl 中检查我的对象权限而不是使用 hasPermission 注释

有没有办法直接从我的代码检查我的类对象权限而不是使用注释模型 PostAuthorize hasPermission returnObject WRITE public BaseData getSingle Long id 假设您打算使用
CLOB 中是否保留转义序列？

我们使用Java和Oracle进行开发我在 Oracle 数据库中有一个表其中有一个 CLOB 列某些 XYZ 应用程序会在此列中转储文本文件文本文件有多行通过 Java 应用程序读取相同的 CLOB 文件时转义序列换行符等
创建视图实例时 Backbone.js 不是构造函数错误

我是backbone js 的新用户正在测试如何使用它最近几天我正在测试如何使用路由通过集合更改视图数据在当前情况下我遇到了一个问题当我尝试在 router js 中创建 ScheduleView 实例时控制台会记录以下错误消息
为什么 Docker 服务停止了？

我将 Ubuntu 作为 Windows 10 上的子系统运行我刚刚按照以下步骤在 Linux 上安装 Docker https docs docker com install linux docker ce ubuntu https d
Cucumber 运行程序类的 Intellij IDEA 运行配置

我是 Intellij IDEA 的新手我有一个基于 POM 的 cucumber selenium 项目我在其中为每个功能文件创建了 cucumber runner 类在使用 Eclipse 时我能够通过右键单击来执行这些运行程序
MySQL Git Bash winpty mysqldump stdout 不是 tty 并且 stdin 不是 tty

请帮助使用 MySQL Git Bash winpty mysqldump winpty mysqldump 在 Git Bash 中不起作用这里是错误的详细信息 Git Bash winpty mysqldump u root p em
Python for 循环变慢并最终挂起

我对 Python 完全陌生截至半小时前并尝试编写一个简单的脚本来枚举 SMTP 服务器上的用户用户文件是一个简单的用户名列表每行一个该脚本运行良好但随着循环的每次迭代它都会变慢直到循环 14 左右它似乎完全挂起没有错误
使用Python（smtplib）发送邮件时指定发件人

我有一段非常简单的代码仅用于测试 import smtplib import time server smtp myprovider com recipients email protected cdn cgi l email prote
如果使用 == 的语句给出了意外的结果[重复]

这个问题在这里已经有答案了 private void refineWords for String word words Log i word word if word s word t word am word is word are w
抽象工厂、工厂方法、构建器

看起来这个问题似乎是一个骗局但请耐心等待我保证我已经阅读了相关帖子以及GOF book https rads stackoverflow com amzn click com 0201633612 在读完所有内容后我仍然不清楚何时使
node.js socket.io 如何发送到特定客户端？

我想向特定客户端发出一条消息该消息是根据不同客户端中收到的另一条消息而选择的我该如何执行此操作我正在考虑将每个客户加入他们自己的房间然后进行广播有没有更好的办法 socket io 1 0 及以上版本的更新 io to so
如何运行多个异步函数然后执行回调？

在我的 Node js 代码中我需要进行 2 或 3 个 API 调用每个调用都会返回一些数据所有 API 调用完成后我想将所有数据收集到一个 JSON 对象中以发送到前端我知道如何使用 API 回调来执行此操作下一个调用将在上
iPhone 扩展音频文件服务，mp3 -> PCM -> mp3

我想使用 Core Audio 扩展音频文件服务框架来读取 mp3 文件将其作为 PCM 进行处理然后将修改后的文件作为 mp3 文件写回我能够将 mp3 文件转换为 PCM 但无法将 PCM 文件作为 mp3 写回我已经跟踪并分析
如何在 Ionic 2+ 中使用按钮样式创建自定义文件输入？

这是我的模板
如何在opencv中仅提取nxn图像的3个特征向量？

我正在尝试使用以下方法将 RGB 图像转换为灰度图像paper https www semanticscholar org paper Novel PCA based color to gray image conversion Seo K

如何在opencv中仅提取nxn图像的3个特征向量？

结论

如何在opencv中仅提取nxn图像的3个特征向量？ 的相关文章

随机推荐

热门标签

如何在opencv中仅提取nxn图像的3个特征向量？的相关文章