使用 python 以字节块的形式读取文件

2024-03-28

我正在尝试将包含超过 10 亿字节的文件转换为整数。显然,我的机器无法立即执行此操作,因此我需要对代码进行分块。我能够解码前 50,000,000 个字节,但我想知道如何读取文件中介于 50,000,001 和 100,000,000、150,000,000 和 200,000,000 等之间的整数。以下是我现在所拥有的;范围函数不适用于此。

import struct
with open(x, "rb") as f:
    this_chunk = range(50000001, 100000000)
    data = f.read(this_chunk)
    ints1 = struct.unpack("I" * (this_chunk //4) , data)
    print(ints1)

您可以使用f.seek(offset) https://stackoverflow.com/a/11696554/4909087设置文件指针从某个偏移量开始读取。

在你的情况下,你想跳过5000000字节,所以你会打电话

f.seek(50000000)

此时,您想阅读另一本50000000字节,所以你会打电话f.read(50000000).


这将是您的完整代码清单,实现f.seek并读取整个文件:

with open(x, "rb") as f:
    f.seek(50000000) # omit if you don't want to skip this chunk
    data = f.read(50000000)
    while data:
        ... # do something 
        data = f.read(50000000)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 python 以字节块的形式读取文件 的相关文章

随机推荐

  • NSURLSession HTTP/2 内存泄漏

    这个我的测试用例指出 当使用带有 HTTP 2 连接的 NSURLSession 时 存在内存问题 测试1 iOS 9 HTTP 2服务器 我使用 NSURLSession 上传 10M 文件到 HTTP 2 服务器 如果文件上传完成一切正
  • GitHub 文件夹上有一个白色箭头

    我最近推送到 github 并在我的一个文件夹上看到一个白色箭头 当我单击该文件夹时 它不会打开它 在我的本地计算机上 它有内容 但在 github 中我无法访问它们 这是什么意思 Symptom 检查本地是否有 git 该文件夹下的子文件
  • 在控制台中动态更改字体

    是否有合适的插件或类来更改公共输出控制台中的字体大小 字体类型和装饰 您可以通过进入首选项来更改终端的字体 但这不是我在这里寻找的 我希望能够从代码内动态更改字体 Ruby 或一些终端命令中有什么可以做到这一点 我使用 Mac OS X A
  • 自动保存对 Chrome 开发工具中现有样式所做的 CSS 更改?

    我已经将必要的文件映射到本地资源 但是 虽然这确实允许我保存对 源 面板中的文件所做的任何更改 但我想知道是否可以自动保存对 元素 面板中对 CSS 所做的更改 否则 目前 对 元素 面板中的样式所做的任何更改似乎只存在于此处 我记得在某个
  • 如何创建自定义文本转语音引擎

    据我所知 TTS 需要 TTS 引擎才能说一种语言 在 Android 模拟器 2 2 中 默认使用 Pico TTS 引擎 它只有一些流行语言 我在市场上看到一些引擎必须购买才能安装 我的问题 有没有办法创建支持其他语言的自定义引擎 通过
  • 如何使 Application.Properties.Settings 公开并保持这种状态

    我正在将我的应用程序设置集中到一个位置 并且我选择使用公共库中的设置集合来执行此操作 我已将所有这些设置移至它们自己的文件中 该文件使用配置源拉入我的 app config 中
  • 如何自动递增 varchar?

    我可以在一张表中为供应商 s0001 s0002 创建一个主键 例如 c0001 c0002 吗 数据库设计的思想是保持每个数据元素独立 每个元素都有自己的数据类型 约束和规则 那c0002不是一个字段 而是两个字段 与相同XXXnnn管他
  • ASP.NET 应用程序中的实体框架 ObjectContext 单元测试

    我使用以下代码为每个 ASP NET 请求创建实体框架 ObjectContext public static class ObjectContextPerRequest public static EStudyTestDatabaseEn
  • 如何使用 MVVM 模式“禁用”WPF 中的按钮?

    我正在尝试掌握 WPF 和 MVVM 并取得了良好的进展 WPF 和 MVVM 方面进展顺利 然而 XAML 和数据绑定方面则完全是另一回事了 我将如何 禁用 按钮 例如 我的视图模型中有一个 CanClose 属性 用于确定当前是否可以关
  • SwiftUI:无法将“Bool”类型的值转换为预期的参数类型“Binding

    为 SwiftUI 创建基于文本的游戏 想知道为什么我无法在字符 ForEach 循环中访问 isSelected 它给出了错误 无法将类型 Bool 的值转换为预期参数类型 Binding 在线上Toggle isOn character
  • 为什么 const_cast 会删除指针的常量性,但不会删除指向 const 的指针?

    我明白那个const cast使用指针和引用 我假设输入const cast应该是一个指针或引用 我想知道为什么如果输入是指针 引用 它不会消除常量性const int 以下代码按预期工作 const cast具有多级指针 int main
  • 如何删除自动完成上的清除按钮并仅显示文本

    我是反应虚拟化和自动完成的新手 我目前已经构建了一个列表 当选中该复选框时 该列表会显示多个文本 这是我的代码 https codesandbox io s material demo forked 1qzd3 file demo tsx
  • Django:限制模型数据

    我正在以一种限制可以通过模型获得的查询集的方式进行搜索 假设我有以下模型 具有依赖项 Company Section Employee Task more models Customer Contract Accounts other gr
  • 使用 dict.values() 或 dict.itervalues() 迭代时修改字典值

    我有一个像这样初始化的字典 tab Mike 0 Chad 15 Taylor 2 我希望能够将整数添加到字典中的每个值 例如 添加 5 后 字典应如下所示 Mike 5 Chad 20 Taylor 7 似乎这可以通过几行代码来完成 但我
  • mvc视图中模型空引用异常

    问题是从控制器传递数据到视图时出现空引用异常 我将模型从控制器传递到视图 如下所示 ViewBag PartId id var viewmodel new Orderviewmodelnew var order new OrderMnage
  • 扩展 APDU 和 T=0/1 通信协议

    我有一个 JCOP V2 4 2 R3 java 卡 它的数据表中提到 该卡支持T 1 and T 0通信协议 我还有一个 ACR38 智能卡读卡器 它支持 T 0 和 T 1 协议 我与一张卡成功进行了 T 0 通信 并且与该卡成功进行了
  • C# 中的 StreamReader 和缓冲区

    我对 StreamReader 的缓冲区使用有疑问 这里 http msdn microsoft com en us library system io streamreader aspx http msdn microsoft com e
  • 如何让 Polymer 2.0 ES5 元素与 v1 规范一起工作?

    我已经成功构建了许多 Polymer 2 0 元素 它们在支持 ES6 的浏览器中运行良好 当我尝试将它们转换为 ES5 时 浏览器会抛出一堆错误 如下所示 Failed to construct HTMLElement Please us
  • 哪些 Web 浏览器支持通过 HTML5 进行地理定位?

    哪些网络浏览器 和版本 支持通过 HTML5 进行地理定位 在桌面上仅支持 Firefox 不确定 Opera 是否已将其包含在官方版本中 在移动设备上 mobile safari 3 和 android 2 x 浏览器 有关支持的更多信息
  • 使用 python 以字节块的形式读取文件

    我正在尝试将包含超过 10 亿字节的文件转换为整数 显然 我的机器无法立即执行此操作 因此我需要对代码进行分块 我能够解码前 50 000 000 个字节 但我想知道如何读取文件中介于 50 000 001 和 100 000 000 15