BMP文件格式详解(BMP file format)

2023-11-10

  BMP文件格式,又称为Bitmap(位图)或是DIB(Device-Independent Device,设备无关位图),是Windows系统中广泛使用的图像文件格式。由于它可以不作任何变换地保存图像像素域的数据,因此成为我们取得RAW数据的重要来源。Windows的图形用户界面(graphical user interfaces)也在它的内建图像子系统GDI中对BMP格式提供了支持。

  下面以Notepad++为分析工具,结合Windows的位图数据结构对BMP文件格式进行一个深度的剖析。

  BMP文件的数据按照从文件头开始的先后顺序分为四个部分:

  Ø  bmp文件头(bmp file header):提供文件的格式、大小等信息

  Ø  位图信息头(bitmap information):提供图像数据的尺寸、位平面数、压缩方式、颜色索引等信息

  Ø   调色板(color palette):可选,如使用索引来表示图像,调色板就是索引与其对应的颜色的映射表

  Ø   位图数据(bitmap data):就是图像数据啦^_^

  下面结合Windows结构体的定义,通过一个表来分析这四个部分。

  我们一般见到的图像以24位图像为主,即R、G、B三种颜色各用8个bit来表示,这样的图像我们称为真彩色,这种情况下是不需要调色板的,也就是所位图信息头后面紧跟的就是位图数据了。因此,我们常常见到有这样一种说法:

  位图文件从文件头开始偏移54个字节就是位图数据了,这其实说的是24或32位图的情况。这也就解释了我们按照这种程序写出来的程序为什么对某些位图文件没用了。

  下面针对一幅特定的图像进行分析,来看看在位图文件中这四个数据段的排布以及组成。

  我们使用的图像显示如下:

  这是一幅16位的位图文件,因此它是含有调色板的。

  在拉出图像数据进行分析之前,我们首先进行几个约定:

  1. 在BMP文件中,如果一个数据需要用几个字节来表示的话,那么该数据的存放字节顺序为“低地址村存放低位数据,高地址存放高位数据”。如数据0x1756在内存中的存储顺序为:

  

  这种存储方式称为小端方式(little endian) , 与之相反的是大端方式(big endian)。对两者的使用情况有兴趣的可以深究一下,其中还是有学问的。

  2.  以下所有分析均以字节为序号单位进行。

  下面我们对从文件中拉出来的数据进行剖析:

    查看原图(大图)

  一、 bmp文件头

  Windows为bmp文件头定义了如下结构体:

双击代码全选
1
2
3
4
5
6
7
8
9
10
  Code highlighting produced by Actipro CodeHighlighter (freeware)
-->typedef struct tagBITMAPFILEHEADER 
{  
UINT16 bfType;    
DWORD bfSize; 
UINT16 bfReserved1; 
UINT16 bfReserved2; 
DWORD bfOffBits;
} BITMAPFILEHEADER; 

  其中:

    查看原图(大图)

  对照文件数据我们看到:

    查看原图(大图)

  1-2  :424dh = 'BM',表示这是Windows支持的位图格式。有很多声称开头两个字节必须为'BM'才是位图文件,从上表来看应为开头两个字节必须为'BM'才是Windows位图文件。

  3-5  :00010436h = 66614 B = 65.05 kB,通过查询文件属性发现一致。

  6-9  :这是两个保留段,为0。

  A-D:00000436h = 1078。即从文件头到位图数据需偏移1078字节。我们稍后将验证这个数据。

  共有14个字节。



双击代码全选
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
  Code highlighting produced by Actipro CodeHighlighter (freeware)
--> 
typedef 
struct
 tagBITMAPINFOHEADER
 {
DWORD biSize; 
LONG biWidth; 
LONG biHeight; 
< a href = "http://tech.ddvip.com/office/word/index.html" target = "_blank" >WORD</ a > biPlanes; 
WORD biBitCount; 
DWORD biCompression; 
DWORD biSizeImage; 
LONG biXPelsPerMeter; 
LONG biYPelsPerMeter; 
DWORD biClrUsed; 
DWORD biClrImportant;
} BITMAPINFOHEADER;

    查看原图(大图) 

  对照数据

  文件:

    查看原图(大图)

  0E-11:00000028h = 40,这就是说我这个位图信息头的大小为40个字节。前面我们已经说过位图信息头一般有40个字节,既然是这样,为什么这里还要给一个字段来说明呢?这里涉及到一些历史,其实位图信息头原本有很多大小的版本的。我们看一下下表:

    查看原图(大图) 

  出于兼容性的考虑,大多数应用使用了旧版的位图信息头来保存文件。而 OS/2 已经过时了,因此现在最常用的格式就仅有V3 header了。因此,我们在前面说位图信息头的大小为40字节。

  12-15:00000100h = 256,图像宽为255像素,与文件属性一致。

  16-19:00000100h = 256,图像高为255像素,与文件属性一致。这是一个正数,说明图像数据是从图像左下角到右上角排列的。

  1A-1B:0001h, 该值总为1。

  1C-1D:0008h = 8, 表示每个像素占8个比特,即该图像共有256种颜色。

  1E-21:00000000h,BI_RGB, 说明本图像不压缩。

  22-25:00000000h,图像的大小,因为使用BI_RGB,所以设置为0。

  26-29:00000000h,水平分辨率,缺省。

  2A-2D:00000000h,垂直分辨率,缺省。

  2E-31:00000100h = 256,说明本位图实际使用的颜色索引数为256,与1C-ID得到的结论一致。

  32-35:00000100h = 256,说明本位图重要的颜色索引数为256,与前面得到的结论一致。

  三、 调色板

  下面的数据就是调色板了。前面也已经提过,调色板其实是一张映射表,标识颜色索引号与其代表的颜色的对应关系。它在文件中的布局就像一个二维数组palette[N][4],其中N表示总的颜色索引数,每行的四个元素分别表示该索引对应的B、G、R和Alpha的值,每个分量占一个字节。如不设透明通道时,Alpha为0。因为前面知道,本图有256个颜色索引,因此N = 256。索引号就是所在行的行号,对应的颜色就是所在行的四个元素。这里截取一些数据来说明:

    查看原图(大图) 

  索引:(蓝,绿,红,Alpha)

  0号:(fe,fa,fd,00)

  1号:(fd,f3,fc,00)

  2号:(f4,f3,fc,00)

  3号:(fc,f2,f4,00)

  4号:(f6,f2,f2,00)

  5号:(fb,f9,f6,00) 等等。

  一共有256种颜色,每个颜色占用4个字节,就是一共1024个字节,再加上前面的文件信息头和位图信息头的54个字节加起来一共是1078个字节。也就是说在位图数据出现之前一共有1078个字节,与我们在文件信息头得到的信息:文件头到文图数据区的偏移为1078个字节一致!

  四、 位图数据

  下面就是位图数据了,每个像素占一个字节,取得这个字节后,以该字节为索引查询相应的颜色,并显示到相应的显示设备上就可以了。

  注意:由于位图信息头中的图像高度是正数,所以位图数据在文件中的排列顺序是从左下角到右上角,以行为主序排列的。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

BMP文件格式详解(BMP file format) 的相关文章

随机推荐

  • Django 启动报错 mysqlclient 1.4.0 or newer is required; you have 0.9.3

    报错原因 MySQLclient 目前只支持到 Python3 4 这里使用了更高版本的 python 那么需要 我们在Django 配置文件目录下 也就是setting py 同级目录下 配置指定版本的mysqlclient pymysq
  • Flowable工作流引擎的使用2(BPMN结构及节点介绍)

    Flowable工作流引擎的使用 2BPMN结构介绍 上一篇讲到了flowable如何使用 用了一个简单的demo 演示了一下流程的创建 发起 审核 查询等功能 内容不多但是引申出很多的概念 BPMN deployId processId
  • 数据分析笔记—数据仓库篇

    数据仓库 数据仓库 Data Warehouse 可简写为DW或DWH 数仓等 它仅适用于查询和分析 通常涉及大量的历史数据 数据仓库中的数据一般来自应用日志文件 数据埋点 和事务应用 实际发生的业务记录的数据 等广泛来源 一个数据仓库通常
  • yolo 推理 nms

    测试代码 另外一个说明cv2绘制不了中文 但可以用其他包实现 from pathlib import Path import cv2 import torch from models common import DetectMultiBac
  • 数组新增的常用方法(es6-es12)-今天一定要学会

    1 forEach 遍历数组中的元素 不改变原数组 2 map 遍历数组 对数组中每个元素做操作并将操作后的元素放到数组中返回 不改变原数组 3 filter 过滤 返回包含所有在回调函数上结果未true的值的新数组 不改变原数组 4 ev
  • 关于CPU的浮点运算能力计算

    原文链接 https www jianshu com p b9d7126b08cc Intel官方参数 https ark intel com FLOAS 核数 单核主频 CPU单个周期浮点计算值
  • 从头开始学Java——JVM虚拟机八问

    文章目录 什么是Java虚拟机 为什么Java被称为 平台无关的编程语言 什么是JIT HotSpot怎么工作的 HotSpot虚拟机要使用解释器与编译器并存的架构 什么是编译时 运行时 编译 运行 编译时运行时问题归纳 反射 描述Java
  • 解决node-sass: Command failed 问题

    从github 下载的vue 源码 yarn 安装报错 爬了下百度 试了好几种方法都没成功 最后ChatGPT帮我解决了 ChatGPT回答 一语命中 好用 node sass 是一个将 Sass 编译为 CSS 的 Node js 模块
  • 关于springboot使用定时器的几种方式

    1 Scheduled注解 Component public class SimpleSchedule private Integer time 0 定时器定义 设置执行时间 Scheduled cron 6 private void pr
  • maven -- 问题解决(二)解决“Could not calculate build plan”问题

    错误提示如下 eclipse maven Could not calculate build plan Failure to transfer org apache maven plugins maven surefire plugin p
  • disabled_button

    直接看题目 然后干他 这里说flag在按钮上 但是我们就是按不了这个flag 那直接看HTML呗 可以看到它这里有个搞鬼的东东 一搜 可以知道这个东西禁止让你输入 你不让我输入 我就给你删了呗 然后我们可以点flag 一点 flag就出来了
  • 关于漏洞"这个页面包含一个错误/警告信息,可能会导致敏感信息泄露"

    公司开发的产品 在用软件扫描漏洞时 扫出了这么一个漏洞 可以看出有漏洞的地方是登录页面 在登录中 主要逻辑如下 一些拒绝登录是通过抛异常 gt 然后捕获异常 gt 获取异常信息 gt 跳回到登录页面并展示错误信息 下面为代码示例 Requs
  • 如何获取 docker 容器(container)的 ip 地址

    1 进入容器内部后 lcc lcc docker exec it docker mysql bash root b3b1d61142df root b3b1d61142df cat etc hosts 127 0 0 1 localhost
  • Hive 是怎样保存元数据的

    保存元数据的方式有 内存数据库derby 本地mysql数据库 远程mysql数据库 本地的mysql数据库用的比较多 因为本地读写速度都比较快 内存数据库derby 安装小 但是数据存在内存 不稳定 mysql数据库 数据存储模式可以自己
  • React 中的元素、组件、实例和节点

    React 元素其实就是一个简单JavaScript对象 一个React 元素和界面上的一部分DOM对应 描述了这部分DOM的结构及渲染效果 一般我们通过JSX语法创建React 元素 React 元素可以分为两类 DOM类型的元素和组件类
  • Java常用API

    文章目录 1 API 1 1 API概述 帮助文档的使用 1 2 键盘录入字符串 2 String类 2 1 String概述 2 2 String类的构造方法 2 3 创建字符串对象的区别对比 2 4 字符串的比较 2 5 String方
  • Docker常用镜像命令

    帮助命令 查看docker版本 docker version 对docker信息的描述 docker info docker的帮助命令 docker help 详解 docker OPTIONS COMMAND docker的命令公式 镜像
  • Text to image论文精读MISE:多模态图像合成和编辑Multimodal Image Synthesis and Editing: A Survey

    由于信息在现实世界中以各种形式存在 多模态信息之间的有效交互和融合对于计算机视觉和深度学习研究中多模态数据的创建和感知起着关键作用 近期 OpenAI 发布的 DALLE 2 和谷歌发布的 Imagen 等实现了令人惊叹的文字到图像的生成效
  • 「经验分享」一款PCB电路板设计要经历哪些流程?

    一款PCB电路板设计主要包括明确产品需求 硬件系统设计 器件选型 PCB绘制 PCB生产打样 焊接调试等步骤 那么这些步骤都有哪些需要注意点呢 小编带你细品 一定要细品 一 明确需求 在一个硬件设计之初 首先要做的是明确产品的需求 这里主要
  • BMP文件格式详解(BMP file format)

    BMP文件格式 又称为Bitmap 位图 或是DIB Device Independent Device 设备无关位图 是Windows系统中广泛使用的图像文件格式 由于它可以不作任何变换地保存图像像素域的数据 因此成为我们取得RAW数据的