色彩空间与像素格式

2023-11-17

转载来自:https://www.cnblogs.com/leisure_chn/p/10290575.html

 

1. 色彩空间基础

颜色是不同波长的光对人眼刺激产生的色彩感觉。色彩空间(Color Space)是颜色的数学表示,根据不同的表示方法分为不同的色彩模型。最常用的色彩模型有三类:RGB(用于计算机图形学), YUV(用于视频系统), CMYK(用于彩色印刷)。后文对色彩空间与色彩模型的叫法不作区分。本文仅讨论视频图像处理领域常用的 RGB 色彩空间和 YUV 色彩空间。

颜色与光源特性和人眼视觉特性有密切的关系,与之相关的学科有光度学和色度学。光度学是研究光学计量的学科,定义了光通量、发光强度、照度、亮度等主要光度学参量以及几个光度学重要定律。光度学考虑的是可见光范围,并且考虑人眼主观影响。色度学是研究色彩计量的科学,它定性和定量地研究人眼的颜色视觉规律、颜色测量理论与技术。色度学是研究视频技术的重要理论基础,将色度学中最基础的两个概念摘录如下。本节内容,是理解图像色彩相关知识的基础,已经简洁的不能再简洁。

1.1 光的常用度量

描述光的常用物理量有四个:光通量、光强、照度、亮度。如下两张示意图引用自“如何正确理解照度和亮度的关系?”,图中涉及三个角色:光源、物体(被观察者)与人眼(观察者)。
 

图 从光源到眼睛

图 光度量示意图

如下概念的描述,力求通俗,因此并不准确。

1.1.1 光通量

单位时间内由光源所发出或由被照物所吸收的总光能。单位流明。
在第一张图中,灯泡在单位时间内散发的的光的总和即为光通量。光通量衡量光源总的发光量。

1.1.2 光强

光源在给定方向上,每单位立体角内所发出的的光通量。单位坎德拉。
在第一张图中,光源射向照射面的一根光线表示光强。光强衡量光源的发光强度。

1.1.3 照度

物体表面每单位面积入射可见光的光通量。单位勒克斯。
照度在被观察者(被照物体)角度,衡量接受到的光的强弱。

1.1.4 亮度

描述发光面或反光面上光的明亮程度的光度量。单位坎德拉每平方米。
亮度在观察者(人眼)角度,衡量感受到的光的明亮程度。
在第二张图中,理想情况下,被同一光源照射,黑色书和白色书具有同样的照度,却有不同的亮度。

1.2 色度学基础

1.2.1 彩色三要素

光的颜色取决于客观和主观两方面的因素。客观因素是光的功率波谱分布,它影响光源的颜色。主观因素是人眼视频特性,它影响人眼对色彩的感觉。 彩色三要素指亮度(Lightness)、色调(Hue)和饱和度(Saturation),任一色彩都可以用这三个基本参量来表示:
亮度表示颜色明暗的程度,是光作用于人眼时引起的明亮程度的感觉。
色调是指颜色的类别,例如红色、蓝色、绿色指的就是色调。
饱和度指颜色的深浅程度,也称彩度。例如深绿、浅绿指的就是绿色这个色调的饱和度,饱和度越高,颜色越深。

1.2.2 三基色原理

三基色原理指自然界中大部分彩色都可以由三种基色按不同比例混合得到。选择三种基色的前提的:每一种基色都不能由另外两种基色混合得到,这三种基色互相独立。三基色原理主要内容如下:

  1. 自然界中的绝大部分彩色,都可以由三种基色按一定比例混合得到;反之,任意一种彩色均可被分解为三种基色。
  2. 作为基色的三种彩色,要相互独立,即其中任何一种基色都不能由另外两种基色混合来产生。
  3. 由三基色混合而得到的彩色光的亮度等于参与混合的各基色的亮度之和。
  4. 三基色的比例决定了混合色的色调和色饱和度。

不同颜色混合在一起能产生新的颜色,这种方法称为混色法。色彩空间 RGB 是采用了 R、G、B 三种基色,色彩空间 CMYK 是采用了 C、M、Y 三种基色。

我们看一张包含彩色三要素和 RGB 三原色的示意图:

 

 

2. RGB 色彩空间

太深的原理已超出本文的讨论范围和研究目的。这里摘录一些经验观点:

RGB 三原色不是唯一的正交基,还可以有其他选择,只不过 RGB 能组合出来的颜色更为丰富。[8]

不考虑人类视觉的特殊性时,我们平时所认为的“红+绿=黄”之类的“颜色叠加”是不成立的。因为红色和绿色的单色光的混合只有在人类的视觉中才会跟黄色的单色光一样,它们在其它动物的视觉中不一定是一样的。也就是说,不考虑人类视觉的特殊性时,不存在 RGB 颜色空间。[8]

人类有三种视锥细胞用于感知颜色,这三种视锥细胞对红(R)、绿(G)、蓝(B)三种颜色敏感。[9]

人眼看到的物体颜色,是光源照射到物体,物体吸收(还有透射)部分颜色的光,然后从物体表面反射的光线进入人眼后人眼得到的色彩感觉。

人眼看到物体为黑色,是因为没有光线从物体表面反射进入人眼。一种情况是物体将光线完全吸收,没有光从物体表面反射出来(例如白天我们看一件黑衣服);另外一种情况是没有任何光线照射到物体(例如黑夜我们看一张白纸)。

人眼看到物体为白色,是因为在白光源照射下,物体不吸收光线而将光线全部反射(例如白天我们看一张白纸)。

颜色与光源和物体的吸色特性密切相关,基于此,引出混色方法中的加色法和减色法。

加色法利用光源发射特性,将各分色的光谱成分相加得到混合颜色。RGB 色彩空间采用加色法。当无任何光线照射时,R、G、B 三种颜色分量都为 0 时,物体呈现黑色;当 R、G、B 三种颜色分量达到最大时,物体不吸收光线只反射的情况下,物体呈现白色。我们称黑色为最暗,白色为最亮,要达到最亮状态,需要三色分量最大程度混合,因此称为加色。


图 2 加色法[11]
加色法用于自发光物体。RGB 颜色空间主要应用于计算机显示器、电视机、舞台灯光等,都具有发光特性。彩色像素在显示器屏幕上不会重叠,但足够的距离时,光线从像素扩散到视网膜上会重叠,人眼会感觉到重叠后的颜色效果。

减色法是利用颜料吸色特性,每加一种颜色的颜料,会吸收掉对应的补色成分。CMYK 色彩空间采用减色法。例如,我们在白纸(白光照射、不吸收、全反射)上涂颜料,黄色颜料能吸收蓝色(黄色的补色),因此在白光照射下显示黄色,当黄(Y)、青(C)、品红(M)三色混在一起且颜色分量都为最大时,它们的补色成分被吸收掉,变成了黑色;当三色分量为 0 即什么也不涂时,白纸显现白色。要达到最大亮度,需要三色分量完全消失,因此称为减色。

印刷时,无法达到理想程度,C、M、Y 最大程度混合后无法得到纯黑色,只能得到深灰色,因此在 C、M、Y 三色之外引入了 K(黑色)。
图 3 减色法[12]
减色法用于无法发光的物体。CMYK 颜色空间主要应用于印刷、绘画、布料染色等。

RGB 色彩空间中每个像素点包含了 R、G、B 三种分量。RGB 存储模式也有 packed 和 planar 两类,这两种模式的区分在第 3 节中讲述。RGB 色彩空间及存储模式比较简单,我们挑几个有代表性的存储模式来简述一下:

2.1 存储模式 RGB565

使用 16b(bit)表示一个像素,5b 用于 R,6b 用于 G,5b 用于 B。如下:

[ R G B ]  [ R G B ]  [ R G B ]  [ R G B ]
[ R G B ]  [ R G B ]  [ R G B ]  [ R G B ]

以上只是示意图,实际 R、G、B 顺序可能与图中不同。

2.2 存储模式 RGB888

使用 24 位来表示一个像素,每个分量都用 8 位表示。其示意图跟 RGB565 示意图类似。

2.3 存储模式 ARGB8888

使用 32 位来表示一个像素,R、G、B 都用 8 位表示,另外 A(Alpha)表示透明度,也用 8 位表示。

[ A R G B ]  [ A R G B ]  [ A R G B ]  [ A R G B ]
[ A R G B ]  [ A R G B ]  [ A R G B ]  [ A R G B ]

以上只是示意图,实际 A、R、G、B 顺序可能与图中不同。

3. YUV 色彩空间

YUV 颜色空间是 PAL、NTSC、SCEAM 三大视频标准使用的颜色空间,主要应用于视频系统。YUV 色彩空间中,Y 表示亮度信息,U 和 V 表示色度(色调和饱和度)信息。使用 YUV 色彩空间,后期出现的彩色电视系统和早期的黑白电视系统兼容,黑白电视机可以只处理彩色电信信号中的 Y 分量,而彩色电视机接收黑白电视信号显示也没有任何问题。

YUV 颜色空间和 RGB 颜色空间可以根据公式相互转换。

经常提到的还有 YPbPr 和 YCbCr。YPbPr 指模拟分量信号(或接口),P(Parallel)表示并行,b 下标表示蓝,r 下标表示红。YCbCr 指的是数字分量信号(或接口),C(Chroma)表示色度。YCbCr 还可指色彩空间,YCbCr 色彩空间是 YUV 色彩空间的缩放和偏移版本。

YUV, YCbCr, YPbPr 所指涉的范围,常有混淆或重叠的情况。从历史的演变来说,其中 YUV 和 Y'UV 通常用来编码电视的模拟信号,而 YCbCr 则是用来描述数字的视频信号,适合影片与图片压缩以及传输,例如 MPEG、JPEG。 但在现今,YUV 通常已经在计算机系统上广泛使用。[14]

3.1 YUV 采样方式与存储模式

人眼有一个特性:对亮度更敏感,对色度没有那么敏感。因此压缩色度分量可以降低数据量,但并不会人眼主观感觉造成太大影响。这是 YUV 采样的理论基础。主流的采样方式有三种,YUV4:4:4,YUV4:2:2,YUV4:2:0。这些采样方式,不压缩 Y 分量,对 UV 分量的压缩程度不同。

同一种采样方式,数据在内存中可以有不同的排布方式。YUV 数据在内存中的排布方式称作 YUV 存储模式。YUV 存储模式分成三大类:
packed:将 Y、U、V 分量交织存放在一起,和 RGB 的存放方式类似。内存中排列形式类似:YVYUYVYUYVYUYVYU...。在具体的存储模式命名中,packed 格式不带后缀 P。
planar:将 Y、U、V 的三个分量分别存放在不同的矩阵(平面)中。内存中排列形式类似:YYYYYY...,UUUUUU...,VVVVVV...。在具体的存储模式命名中,planar 格式带后缀 P。
semi-planar:将 Y、U、V 三个分量放在两个矩阵(平面)中。Y 占用一个平面,UV 共用一个平面。内存中排列形式类似:YYYYYY...,UVUVUV...。在具体的存储模式命名中,semi-planar 格式带后缀 SP。

注意:packed 格式通常用于只含水平采样的采样方式。packed 格式不能处理垂直采样,否则会导致不同的行尺寸不一。

YUV 图像存储模式与采样方式密切相关。一种采样模式下有多种不同的存储模式。

存储模式是一种较粗粒度的划分方式,主要依据不同分量在不同 plane 中的排列顺序来划分存储模式,一种存储模式定义了各分量样本在内存中的布局方式,而更一步的细节并不明确。像素格式则是细粒度的划分方式,一种像素格式中图像数据的内存组织方式的所有细节都是确定的,像素格式在第 4 节讲解。

3.2 采样方式的命名含义

本节内容整理自参考资料[2]。

为方便描述,我们将一个 Y 值称作一个亮度样本。一对 Cb+Cr 值称作一个色度样本。因为采样方式中只对色度进行下采样,不对亮度进行下采样,所以在一幅图像中,亮度样本数等于图像像素总数。

3.2.1 J
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

色彩空间与像素格式 的相关文章

  • Qt 5 和 OS X Mavericks 问题

    我正在使用 Cmake 在 OS X 10 9 上构建 QT 项目 自 Mavericks 以来 OpenGL 标头的位置似乎发生了变化 文件夹 System Library Frameworks OpenGL framework Head
  • 将 CVPixelBuffer 渲染到 NSView (macOS)

    我有一个CVPixelBuffer我正在尝试在屏幕上有效地绘制 转变为低效率的方式NSImage可以工作 但速度非常慢 丢掉了大约 40 的帧数 因此 我尝试使用将其渲染在屏幕上CIContext s drawImage inRect fr
  • 使用 openGL、SOIL 加载图像

    我尝试了很多使用 SOIL 在 openGL 中加载和显示图像的示例 运行下面的源代码时 它仅显示一个没有图像的白色四边形 我尝试打开一个名为 foto 的图像 我将图像文件放在程序的文件夹中 bool keyStates new bool
  • 纹理openGl。 C++、qt

    我试图用草纹理覆盖我的地形 由高度图制成 但它没有按预期工作 我什至无法在简单的 GL QUAD 上获取纹理 结果是多色网络 void GLWidget initializeGL glEnable GL TEXTURE 2D 在 QGLwi
  • OpenGL 的每个组件 alpha 通道?

    是否可以使用 OpenGL 对每个组件使用一个 alpha 通道 一个用于红色 一个用于绿色 一个用于蓝色 进行混合 如果没有 有哪些可能的解决方法 这不是直接支持的东西 不过 您自己实现起来相当容易 使用 3 通道 alpha 纹理渲染三
  • 在 OpenGL 中,为什么 glVertexAttribPointer 要求“指针”参数以 void* 形式传入?

    规格为glVertexAttribPointer如下 void glVertexAttribPointer GLuint index GLint size GLenum type GLboolean normalized GLsizei s
  • 三角形未在 OSX 上的 OpenGL 2.1 中绘制

    我正在学习有关使用 OpenGL 在 Java 中创建游戏引擎的教程 我正在尝试在屏幕上渲染一个三角形 一切运行良好 我可以更改背景颜色 但三角形不会显示 我还尝试运行作为教程系列的一部分提供的代码 但它仍然不起作用 教程链接 http b
  • 法线在 openGL 中表现得很奇怪

    我一直在为 openGl 编写一个 obj 加载器 几何体加载得很好 但法线总是混乱的 我尝试在两个不同的程序中导出模型 但似乎没有任何效果 据我所知 这就是将法线放入 GL TRIANGLES 的方法 glNormal3fv norm1
  • QOpenGLFunctions 缺少重要的 OpenGL 函数

    QOpenGLFunctions 似乎缺少重要的函数 例如 glInvalidateFramebuffer 和 glMapBuffer 据我了解 QOpenGLFunctions 加载桌面 OpenGL 函数和 ES 函数的交集 如果是这样
  • OpenGL 着色器不与着色器程序链接

    我正在尝试使用 GLFW GLEW 添加着色器 我收到一个错误 指出着色器已加载 但它们没有有效的对象代码 这是我用于加载着色器的代码 class SHADER public void LoadShaders const char vert
  • OpenGL 中连续暂停

    void keyPress unsigned char key int x int y int i switch key case f i 3 while i x pos 3 sleep 100 glutPostRedisplay 上面是在
  • Eclipse 标记 OpenGL 函数无法解析

    我尝试在 Eclipse C C 中使用一些 OpenGL 函数 一些 标准 函数如 GlClear 可以被 eclipse 识别 而其他函数如 glBindBuffer 和 glEnableVertexAttribArray 则不能 它们
  • 当 OpenGL 中同时绑定 1D 和 2D 纹理时,正确的行为是什么?

    假设你有这样的东西 glBindTexture GL TEXTURE 2D my2dTex glBindTexture GL TEXTURE 1D my1dTex glBegin 正确的 OpenGL 行为是什么 要绘制一维纹理 二维纹理还
  • GLSL NVidia 方形神器

    当 GLSL 着色器在以下 GPU 上生成不正确的图像时 我遇到了问题 GT 430 GT 770 GTX 570显卡760 但在这些上正常工作 英特尔高清显卡 2500英特尔高清4000英特尔4400显卡740MRadeon HD 631
  • OpenGL缓冲区更新[重复]

    这个问题在这里已经有答案了 目前我正在编写一个模拟水的程序 以下是我所做的步骤 创建水面 平面 创建VAO 创建顶点缓冲区对象 在其中存储法线和顶点 将指针绑定到此 VBO 创建索引缓冲区对象 然后我使用 glDrawElements 渲染
  • Visual Studio 2010 中的 SOIL 设置

    我无法得到SOIL http www lonesock net soil html正确使用 Visual Studio 2010 我远非 VS 专家 但据我所知 只需执行以下步骤即可使环境正常运行 属性 gt gt C C gt 常规 gt
  • 三角形纹理映射OpenGL

    我正在开发一个使用 Marching Cubes 算法并将数据更改为 3D 模型的项目 现在我想在 OpenGL 中为我的 3D 模型使用纹理映射 我首先尝试了一个简单的示例 它将图片映射到三角形上 这是我的代码 int DrawGLSce
  • 存储 OpenGL 状态

    假设我正在尝试用 C 制作某种小型 opengl 图形引擎 我读过通过访问 opengl 状态glGet 函数可能非常昂贵 虽然访问 opengl 状态似乎是一个经常操作 并且强烈建议将 opengl 状态的副本存储在具有快速读 写访问权限
  • 使用 GLSL 直接在着色器中从位置计算平移矩阵

    我正在开发 C OpengL 程序以及 GLSL 顶点和片段着色器 我正在创建同一对象的多个实例 我只需要改变实例之间的对象位置 这是我所做的 我正在使用一个统一变量 它是一个变换矩阵数组 每个矩阵代表一个对象实例 MVP 也是一个变换矩阵
  • OpenGL:伽玛校正图像看起来不线性

    我使用 OpenGL 进行渲染 当我将线性值写入默认帧缓冲区 没有任何伽玛校正 时 它们在我的显示器上显示为线性 这违背了我认为我所知道的关于伽马校正的一切 如下所述 http gamedevelopment tutsplus com ar

随机推荐

  • Web前端复习——JS(正则表达式+内置对象)

    正则表达式 专门规定字符中字符 格式规则 的表达式 何时使用 只要定义字符串格式规则 都用正则表达式 最简单正则 一个关键词的原文 就是最简单的正则 1 备选字符集 规定某 一位 字符可选的备选文字列表 语法 备选字符列表 强调 1 无论备
  • 增广拉格朗日函数的三种统一公式

    Unified theory of augmented Lagrangian methods for constrained global optimization 增广拉格朗日函数统一为一下三种形式 L P x
  • php做密码验证,PHP密码验证

    我在 PHP中进行了注册验证 我正在对每个字段进行故障排除 以查看代码是否符合标准 当我按下提交按钮时 唯一不起作用的部分是密码 确认密码代码块 我已经进行了几个小时的故障排除 似乎无法找到问题 有人可以指出这个问题吗 谢谢 define
  • 微信小程序1rpx border ios真机显示不全问题分析及解决方案

    微信小程序在iphone6或6p真机上如果有一排有边框的标签时 可能会出现个别边框显示不全的问题 下面进行一步一步分析 1 页面内容如下 wxml内容
  • uniapp封装request函数 实现唯一登录,一个账号同时只能登陆一个设备

    今天有空 所以又来总结自己的工作啦 今天写如何封装request请求并且 在每个请求这里通过设置token实现唯一登录的问题 一个账号同一时间只能登陆一个账号 先上封装的request代码啦 这个是借鉴网上的资料写的 我会把博主的链接放在本
  • 输入一行字符,分别统计出其数字、大写字母、小写字母和其他字符的个数。

    Ptw cwl 输入一行字符 分别统计出其数字 大写字母 小写字母和其他字符的个数 提示 比如 输入 lwlr abz456 Wb 一行字符是你编写方法的参数 输入一行字符 分别统计出其数字 大写字母 小写字母和其他字符的个数 public
  • windows使用小技巧 ━━ Windows 10 HEVC扩展要收费怎么办?教你怎么免费下载HEVC扩展

    现在最新的方法 Download K Lite Codec Pack Full 可以无视下面的内容 平时我一般都使用potplayer打开视频 但在整理视频的时候mov格式的文件总是不能显示缩略图 如果用windows10自带图片查看器打开
  • 2013-2020年全国31省数字经济数据集

    1 时间 2013 2020年 2 来源 整理自国家统计J和统计NJ 3 指标包括 信息化基础 光缆线路长度 公里 移动电话基站 万个 信息传输 软件和信息技术服务业城镇单位就业人员 万人 年末常住人口 万人 城镇单位就业人员 万人 光缆密
  • AcWing 1247. 后缀表达式

    老师的讲课网址 https www acwing com video 736 第二个图就已经告诉我们只要有一个减号 我们就可以组成至少含一个减号的所有组合 比如说一个减号三个加号我们可以组合成 1 2 3 4 所以代码如下 include
  • The 2022 ICPC Asia Xian Regional Contest--G. Perfect Word

    You are given nn strings and required to find the length of the longest perfect word A string t is called a perfect word
  • caffe: test code 执行出问题: Check failed: FLAGS_weights.size() > 0 (0 vs. 0) Need model weights to score...

    Check failed FLAGS weights size gt 0 0 vs 0 Need model weights to score 出现这个错误 但是我记得昨天还好好的 网上搜了也没有答案 后来仔细检查才发现 原来存放 caff
  • QT5.9.4 + opencv3.0.0编译配置

    QT5 9 4 opencv3 0 0编译配置 1 安装QT5 9 4 QT下载地址 http download qt io archive qt 安装完毕之后将以下目录加入到系统环境变量 E Qt Qt5 9 4 5 9 4 mingw5
  • windows系统pycharm安装,opencv安装,anaconda安装

    1 python IDE安装 3 9 https www python org getit 2 pycharm安装 社区版最新 https www jetbrains com pycharm 3 anaconda3安装 https www
  • Electron 自定义 Dock 图标

    转载自https cloud tencent com developer article 1650700 学透 Electron 自定义 Dock 图标 Mac OS 做为前端开发者的首选操作系统相信大家再熟悉不过了 在电脑主界面的底部可以
  • epoll在多线程中的应用-EPOLLEXCLUSIVE和REUSEPORT(一)

    以下均为对epoll在多线程中的使用的一些笔记 如果有不对的地方 烦请指出 主要对于我所遇到的问题进行讨论 不会讨论代码如何改写 探讨如何解决这个问题 一 引言 这些问题均是我在编写我的Web服务器遇到的 我在编写多线程Web服务器的时候
  • Docker 镜像库国内加速的几种方法

    概述 在国内 拉取 Docker 镜像速度慢 时不时断线 无账号导致限流等 比较痛苦 这里提供加速 优化的几种方法 梳理一下 会碰到以下情况 国内下载速度慢 时不时断线 是因为网络被限制了 没有公共镜像库账号导致限流 是因为 Docker
  • 「网页开发|前端开发|Vue」01 快速入门:快速写一个Vue的HelloWorld项目

    本文主要介绍如何用vue开发的标准化工具vue cli快速搭建一个符合实际业务项目结构的hello world网页项目并理解vue的代码文件结构以及页面渲染流程 文章目录 一 准备工作 安装node js 二 项目搭建 创建项目目录 全局安
  • 谁来教我渗透测试——黑客应该掌握的Windows基础

    今天我们看看作为一个黑客对于Windows应该掌握哪些基础知识 主要内容包含以下四个方面 系统目录 服务 端口和注册表 黑客常用的DOS命令及批处理文件的编写 黑客常用的快捷键 以及如何优化系统 登录密码破解 手动清除木马病毒 系统目录 服
  • 2014年总结

    总结的意义在于认清未来的方向 2014年工作 1 ETL Data Warehouse Data Mining 数据挖掘内容很多 如何与企业需求相结合是重点 2 简单的工作流系统开发 3 体会ArgGIS在物流运输企业中的应用 无论云计算以
  • 色彩空间与像素格式

    转载来自 https www cnblogs com leisure chn p 10290575 html 1 色彩空间基础 颜色是不同波长的光对人眼刺激产生的色彩感觉 色彩空间 Color Space 是颜色的数学表示 根据不同的表示方