Python正则表达式搜索十六进制字节

2023-12-02

我正在尝试在二进制文件中搜索一系列十六进制值，但是，我遇到了一些无法完全解决的问题。 (1) 我不知道如何搜索整个文件并返回所有匹配项。目前，我的 f.seek 只达到了我认为可能的值，这不好。 (2) 我想以十进制或十六进制形式返回可能匹配的偏移量，尽管每次都得到 0，所以我不确定我做错了什么。

示例.bin

AA BB CC DD EE FF AB AC AD AE AF BA BB BC BD BE
BF CA CB CC CD CE CF DA DB DC DD DE DF EA EB EC

code:

# coding: utf-8
import struct
import re

with open("example.bin", "rb") as f:
    f.seek(30)
    num, = struct.unpack(">H", f.read(2))
hexaPattern = re.compile(r'(0xebec)?')
m = re.search(hexaPattern, hex(num))
if m:
   print "found a match:", m.group(1)
   print " match offset:", m.start()

也许有更好的方法来完成这一切？

我不确定如何搜索整个文件并返回所有匹配项。

我想以十进制或十六进制返回偏移量

import re

f = open('data.txt', 'wb')
f.write('\xAA\xBB\xEB\xEC')
f.write('\xAA\xBB\xEB\xEC')
f.write('\xAA\xBB\xEB\xEC')
f.write('\xAA\xBB\xEB\xEC')
f.write('\xAA\xBB\xEB\xEC')
f.write('\xAA\xBB\xEB\xEC')
f.write('\xAA\xBB\xEB\xEC')
f.close()

f = open('data.txt', 'rb')
data = f.read()
f.close()

pattern = "\xEB\xEC"
regex = re.compile(pattern)

for match_obj in regex.finditer(data):
    offset = match_obj.start()
    print "decimal: {}".format(offset)
    print "hex(): " + hex(offset)
    print 'formatted hex: {:02X} \n'.format(offset)

--output:--
decimal: 2
hex(): 0x2
formatted hex: 02 

decimal: 6
hex(): 0x6
formatted hex: 06 

decimal: 10
hex(): 0xa
formatted hex: 0A 

decimal: 14
hex(): 0xe
formatted hex: 0E 

decimal: 18
hex(): 0x12
formatted hex: 12 

decimal: 22
hex(): 0x16
formatted hex: 16 

decimal: 26
hex(): 0x1a
formatted hex: 1A

文件中的位置像列表一样使用基于 0 的索引。

e.finditer(模式、字符串、标志=0)
返回一个迭代器，生成所有 MatchObject 实例字符串中 RE 模式的非重叠匹配。该字符串是从左到右扫描，并按找到的顺序返回匹配项。

匹配对象支持以下方法和属性：
开始（[组]）
结束([组])
返回开始和结束的索引组匹配的子字符串；组默认为零（意味着整个匹配的子字符串）。

https://docs.python.org/2/library/re.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

Binary

seek

Python正则表达式搜索十六进制字节的相关文章

匹配所有有效格式 IPv6 地址的正则表达式

乍一看我承认这个问题看起来像是这个问题以及与之相关的任何其他问题的重复匹配有效 IPv6 地址的正则表达式 https stackoverflow com questions 53497 regular expression that
scipy.optimize on pandas dataframe

我试图搜索它但结果很差有人可以向我解释一下如何在 Pandas DataFrame 上执行 optimize minimize 以便最小化 DataFrame 中的类别和结果列之间的错误考虑这个例子 import pandas as
如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th
Matplotlib 图例，跨列添加项目而不是向下添加项目

对于下面的简单绘图有没有办法让 matplotlib 填充图例以便它从左到右填充行而不是第一列然后第二列 gt gt gt from pylab import gt gt gt x arange 2 pi 2 pi 0 1 gt gt
雅虎财务请求功能出现 404 客户端错误

yahoo Financials的请求功能出现404 Client Error 直接点击以下网址没有问题 https finance yahoo com quote AAPL financials p AAPL https finance
App Engine NDB：如何访问属性的 verbose_name

假设我有这个代码 class A ndb Model prop ndb StringProperty verbose name Something m A m prop a string value 当然现在如果我打印 m prop 它会
用 Python 绘制直方图

我有两个列表 x 和 y x 包含字母表 A Z Y 包含它们在文件中的频率我尝试研究如何在直方图中绘制这些值但在理解如何绘制它方面没有成功 n bins patches plt hist x 26 normed 1 facecolor
正在使用 PIL 保存损坏的图像

我遇到一个问题操作图像像素导致保存损坏的图像因此我使用 PIL 打开图像然后将其转换为 NumPy 数组 image Image open myimage png np image np asarray image 然后我转置图像
使用正则表达式搜索 Ruby 数组

你好我有一个小的 ruby 函数它可以分割出一个 Ruby 数组如下所示 def rearrange arr from to sidx arr index from eidx arr index to arr sidx arr sid
数据框中 .map(str) 和 .astype(str) 有什么区别

我有一个数据框其列名为 col1 和 col2 的整数类型条目我想将 col1 和 col2 的条目以及其间的点连接起来我搜索并发现添加两个列条目 df col df col1 map str df col2 map str 并添
将 window.location 传递给 Flask url_for

我正在使用 python 在我的页面上当匿名用户转到登录页面时我想将一个变量传递到后端以便它指示用户来自哪里发送 URL 因此当用户单击此锚链接时 a href Sign in a 我想发送用户当前所在页面的当前 URL
为什么将模块级代码放入函数中然后调用该函数在Python中速度更快？

在亚历克斯马尔泰利的回应中使 Python 脚本面向对象 https stackoverflow com questions 1813117 making a python script object oriented 他提到在 Pyth
python Recipe：列出最接近等于值的项[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案考虑像这样的列表 0 3 7 10 12 15 19 21 我想获得最接近任何值的最近的最小数字所以如果我通过4 我会得到3 如果我
正则表达式库基准

我最近一直想知道正则表达式实现的性能并且很难想出很多有用的信息它很容易对浏览器 javascript 正则表达式性能进行基准测试网上有很多工具 Chrome 和 Opera 中的 javascript 正则表达式实现几乎摧毁了所有其他
如何展平解析树并存储在字符串中以进行进一步的字符串操作 python nltk

我正在尝试从树结构中获取扁平树如下所示我想将整个树放在一个字符串中就像没有检测到坏树错误一样 S NP SBJ NP DT The JJ high JJ seven day PP IN of NP DT the CD 400 NNS
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
UnicodeDecodeError：部署到 Heroku 时，“utf-8”编解码器无法解码位置 0 中的字节 0xff

我尝试在heroku上部署我的简单django项目但我不明白如何解决这个问题这是git push heroku master remote Traceback most recent call last remote File tmp
python中有没有一种方法可以将存储在列表中的正则表达式模式列表应用到单个字符串？

我有一个正则表达式模式列表存储在列表类型中我想将其应用于字符串有谁知道一个好方法将列表中的每个正则表达式模式应用于字符串和如果匹配则调用与列表中该模式关联的不同函数如果可能的话我想用 python 来做这件事提前致谢 im
两种 ODE 求解器之间的差异

我想知道两者之间有什么区别ODEINT and solve ivp用于求解微分方程它们之间有什么优点和缺点 f1 solve ivp f 0 1 y0 y0 is the initial point f2 odeint f y0 0 1
为boost python编译的.so找不到模块

我正在尝试将 C 代码包装到 python 中只需一个类即可导出两个函数我编译为map so 当我尝试时import map得到像噪音一样的错误 Traceback most recent call last File

随机推荐

从 url 中删除 # 后无法通过更改 url 在 flutter web 中导航

I was able to navigate to other pages by changing the url of my flutter web hosted on netlify manually deployed by typin
通过 ref 传递 List [重复]

这个问题在这里已经有答案了可能的重复通过 ref 传入对象使用下面的代码输出将是 Without With 1 Code static void Main string args var listWithoutRef new Lis
多个文件的 Bash 输入

我有数千个两组文件一组以 name ext 结尾另一个文件名以 name ext in 结尾因此对于每个 name ext 都有一个 name ext in 现在我必须将其作为参数传递给脚本例如customise pl name e
如何确定Android设备的最小宽度

我对与不同屏幕尺寸相关的 Android 布局概念很陌生我希望为 8 英寸的选项卡制作不同的布局并将其放置在 layout swxxxx 文件夹中并在 layout 文件夹中为大于 8 英寸的选项卡提供另一个通用布局这是我的 8 英
进入电话会议时如何识别？

无论如何有没有办法识别何时通话从一对一转为多方电话会议是否有任何类型的广播或事件被调用 Thanks 不幸的是目前还没有这是由系统管理的开发人员无法访问你最接近的是电话管理器但您只能真正访问有关手机的基本信息我相信这主要是
Actor 方法启动/停止日志 |添加附加信息

对于 azure actor 服务 Actor Method Start Stop 会记录在诊断窗口中如下所示如何在每次调用方法时添加一些额外的详细信息例如 Correlation Id Timestamp 2016 09 14T
用于检索 PDF 的 SAP BI Open Doc URL

在我们使用的报告应用程序中我们使用 BI 3 x API 来生成 Web 报告在进行到 4 x 版本的迁移活动时我们认为使用开放文档 URL 比通过 API 生成报告更好我见过的许多示例都使用sIDType and iDocID参数
Pig 脚本：加入多个文件

我正在读取一个大文件超过十亿条记录并将其与其他三个文件连接我想知道是否可以使该过程更有效以避免在大表上进行多次读取小表可能不适合记忆 A join smalltable1 by f1 f2 RIGHT OUTER massive
了解是否使用了 const 限定符

C 中是否有任何方法可以查找变量是否具有 const 限定符或者如果它存储在 rodata 部分中例如如果我有这个功能 void foo char myString 在这两个不同的函数调用中应采取不同的操作 char str abc
C++ CRTP 初始化

我在运行以下程序时遇到了段错误 include
在 C++ 中解析字符串中的键/值对

我正在使用 C 11 没有 Boost 我有一个函数它接受一个 std string 作为输入其中包含一系列键值对用分号分隔并返回从输入构造的对象所有密钥都是必需的但可以按任意顺序排列下面是一个输入字符串示例顶部 0 底部
关于 perl 到 python 互操作的建议？

我们有相当大的 Perl 代码库在可预见的未来我们的代码库将保留在 Perl 中不过我们正在考虑添加基于 GUI 的仪表板实用程序我们正在考虑用 Python 编写仪表板使用 tkinter 或 wx 然而问题是我们希望在 P
pip 在哪里使用虚拟环境安装包？

情况我创建了一个虚拟环境并使用显式路径来运行pip 无货源activate 是否在全局安装包dist packages或者将它们安装在虚拟环境中site packages Details As pip 在哪里安装它的软件包解释说 pip
在模型中使用助手：如何包含助手依赖项？

我正在编写一个处理来自文本区域的用户输入的模型遵循以下建议http blog caboo se articles 2008 8 25 sanitize your users html input 我在保存到数据库之前使用 before v
如何获取Android Q中特定文件夹的路径

我正在尝试显示保存在图库中特定文件夹中的所有图像安卓Q getExternalStoragePublicDirectory方法已弃用且不起作用如何获取文件夹的路径安卓Q Override protected ArrayList
如何使用 Jupyter + SparkR 和自定义 R 安装

我正在使用 Dockerized 映像和 Jupyter Notebook 以及 SparkR 内核当我创建 SparkR 笔记本时它使用 Microsoft R 3 3 2 安装而不是普通的 CRAN R 安装 3 2 3 我使用的
沿着旋转路径附加影片剪辑（通过 AS3）

我该怎么办沿着路径其他影片剪辑附加影片剪辑例如脚步声这将在一次附加一个影片剪辑的时间间隔内我需要旋转即脚步应该根据路径方向旋转 Thanks 1 创建坐标数组这是你的路您可以通过多种方法来实际创建数组但结果应该与此类似
java do while循环在满足条件后继续循环

我是一名新的java程序员我正在编写一个程序为3台打印机设置3个型号如果用户输入错误的值我希望它继续询问用户型号我让它工作但前提是用户输入的第一个值是 3 台打印机之一的编号如果第一个值不是可能的值之一并且第二个输入是则它仍
如何在Android中使用dimens.xml？

当我设计布局时由于可维护性主题我将所有维度集中在 dimens xml 中我的问题是这是否正确最好的做法是什么关于这方面的信息很少什么都没有我知道将布局的所有字符串集中在 strings xml 上将颜色集中在 color
Python正则表达式搜索十六进制字节

我正在尝试在二进制文件中搜索一系列十六进制值但是我遇到了一些无法完全解决的问题 1 我不知道如何搜索整个文件并返回所有匹配项目前我的 f seek 只达到了我认为可能的值这不好 2 我想以十进制或十六进制形式返回可能匹配的偏移量

Python正则表达式搜索十六进制字节

Python正则表达式搜索十六进制字节 的相关文章

随机推荐

热门标签

Python正则表达式搜索十六进制字节的相关文章