使用 python 以字节块的形式读取文件

2024-03-28

我正在尝试将包含超过 10 亿字节的文件转换为整数。显然，我的机器无法立即执行此操作，因此我需要对代码进行分块。我能够解码前 50,000,000 个字节，但我想知道如何读取文件中介于 50,000,001 和 100,000,000、150,000,000 和 200,000,000 等之间的整数。以下是我现在所拥有的；范围函数不适用于此。

import struct
with open(x, "rb") as f:
    this_chunk = range(50000001, 100000000)
    data = f.read(this_chunk)
    ints1 = struct.unpack("I" * (this_chunk //4) , data)
    print(ints1)

您可以使用f.seek(offset) https://stackoverflow.com/a/11696554/4909087设置文件指针从某个偏移量开始读取。

在你的情况下，你想跳过5000000字节，所以你会打电话

f.seek(50000000)

此时，您想阅读另一本50000000字节，所以你会打电话f.read(50000000).

这将是您的完整代码清单，实现f.seek并读取整个文件：

with open(x, "rb") as f:
    f.seek(50000000) # omit if you don't want to skip this chunk
    data = f.read(50000000)
    while data:
        ... # do something 
        data = f.read(50000000)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

使用 python 以字节块的形式读取文件的相关文章

在 python pandas 中将级别附加到列索引

我有几个具有相同列的数据框我只想在它们的索引上合并 print df1 out Value ISO Id 200001 8432000000 USD 200230 22588186000 USD 200247 4633000000 USD
如何获取Python对象父级？

所以我试图获取自定义对象内部的对象这是一个例子假设 o 是一个对象无论是什么类型它都可以存储变量 o Object class Test def init self self parent o This is where I
字符串在内部存储为单独的字符，内存中的每个字符都由其他类似的字符串共享吗？

例如是字符串var1 ROB 存储为 3 个内存位置 R O 和 B 每个位置都有自己的地址和变量var1指向内存位置R 那它怎么指向O和B呢并执行其他字符串例如 var2 BOB 指向内存中相同的 B 和 Ovar1指的是字符串如
我应该使用 Pylons 还是 Pyramid？

我本来打算从 Django 迁移到 Pylons 但后来我遇到了 Pyramid 塔架和金字塔有什么区别我读了一些文字塔书 http pylonsbook com 目前涵盖 Pylons 0 9 7 并且想知道它是否是 Pylons 和
字符串中数字的连续相加

我是一名正在学习 python 的新程序员并且在如何完成此任务方面遇到了困难所以本质上我有一个从文件导入的数字字符串需要读取并且需要将第一个数字的总和添加到第二个数字并将其转换为正确的 ascii 字符因此例如如果我正在读取字符
将 Python 字典中的键替换为唯一值

a 0 PtpMotion 1 PtpMotion 2 LinMotion 3 LinMotion 4 LinMotion 5 LinMotion 6 LinMotion 7 LinMotion 8 LinMotion 9 PtpMotio
通过 beautiful soup python 找到所有字体大小大于最常见字体的跨度样式

我了解如何从特定的位置获取文本div or span这个问题的风格如何找到最常见的跨度样式 https stackoverflow com questions 40762692 is there a way to find the mos
增加 sigmoid 预测输出值？

我创建了一个用于文本分类的 Conv1D 模型当在最后一个密集处使用 softmax sigmoid 时它产生的结果为 softmax gt 0 98502016 0 0149798 sigmoid gt 0 03902826 0 00
获取每行最后 150 行中所有正值的计数 - pandas

我有以下数据集其中有列Date and Values对于每一行它两者都有 ve and ve价值观我必须计算最后 150 行的所有正值在每一行因此前 150 行将具有空值然后以下行将具有最后 150 行的计数 ve行类似地
初始化整数变量以进行比较

我正在学习麻省理工学院的开放课件课程计算机科学和 Python 编程简介 https ocw mit edu courses electrical engineering and computer science 6 0001 introd
谷歌colab录音，如何实现更精确的方式告诉用户开始对着麦克风说话

我正在尝试创建一个为机器学习项目录制音频的程序我想使用 google colab 这样人们就不必在他们的系统上安装或运行任何东西我在网上找到了这个录制和播放音频的示例单元格 1 包含用于录制音频的 js 代码和用于将其转换为字节对象的
numpy 相关系数错误 - RuntimeWarning：true_divide 中遇到无效值

当我尝试查找数据系列之间的相关性时出现以下错误 gt gt gt i 1 1 1 gt gt gt j 2 2 2 gt gt gt import numpy as np gt gt gt np corrcoef i j usr loca
如何在Python Selenium中获取WebElement的类名？

我使用 Selenium WebDriver 来抓取从网页中获取的用 JavaScript 编写的表格我正在迭代表行列表每行可能属于不同的类别我想获取此类的名称以便我可以为每一行选择适当的操作 table body table f
在未运行 python 中的函数的情况下检查了非本地语句[重复]

这个问题在这里已经有答案了以前我认为当我们定义一个函数时该函数可能是错误的但python在执行之前不会检查它 x 100 def f x 1 0 return x print x gt gt gt 100 然而当我学习的时候nonl
2D 矩阵上的 Numpy where()

我有一个像这样的矩阵 t np array 1 2 3 foo 2 3 4 bar 5 6 7 hello 8 9 1 bar 我想获取行包含字符串 bar 的索引在一维数组中 rows np where t bar 应该给我索引 0 3
具有默认参数的Python类构造函数[重复]

这个问题在这里已经有答案了可能的重复 Python 中的最不令人惊讶可变默认参数 https stackoverflow com questions 1132941 least astonishment in python the m
从值数组中计算 sympy 表达式

我正在尝试 sympy 但遇到了一个无法解决的问题使用 scipy 我可以编写一个表达式并计算 x 值数组如下所示 import scipy xvals scipy arange 100 100 0 1 f lambda x x 2 f
子进程调用，它们是并行完成的吗？

我一直在谷歌搜索这个问题的答案但似乎没有一个答案谁能告诉我如果subprocess模块是否并行调用 Python 文档建议它可用于生成新进程但没有提及它们是否并行如果它们可以并行完成您能否给我举一个例子或将我链接到一个例子这取决
pyodbc 无法正确处理 unicode 数据

我确实使用 pyodbc 成功连接了 MySQL 数据库并且它可以很好地处理 ascii 编码的数据但是当我打印使用 unicode utf8 编码的数据时它引发了错误 UnicodeEncodeError ascii codec c
评估 df 每行中的日期时间函数是否落在另一个 df 中的日期时间范围内

我是 python 新手需要一些帮助来解决有关日期时间函数的问题 I have df a其中有一列标题为time 我正在尝试创建一个新专栏id在这个df a 我想要id根据时间是否包含在某个时间范围内来确定的列df b date 和 da

随机推荐

NSURLSession HTTP/2 内存泄漏

这个我的测试用例指出当使用带有 HTTP 2 连接的 NSURLSession 时存在内存问题测试1 iOS 9 HTTP 2服务器我使用 NSURLSession 上传 10M 文件到 HTTP 2 服务器如果文件上传完成一切正
GitHub 文件夹上有一个白色箭头

我最近推送到 github 并在我的一个文件夹上看到一个白色箭头当我单击该文件夹时它不会打开它在我的本地计算机上它有内容但在 github 中我无法访问它们这是什么意思 Symptom 检查本地是否有 git 该文件夹下的子文件
在控制台中动态更改字体

是否有合适的插件或类来更改公共输出控制台中的字体大小字体类型和装饰您可以通过进入首选项来更改终端的字体但这不是我在这里寻找的我希望能够从代码内动态更改字体 Ruby 或一些终端命令中有什么可以做到这一点我使用 Mac OS X A
自动保存对 Chrome 开发工具中现有样式所做的 CSS 更改？

我已经将必要的文件映射到本地资源但是虽然这确实允许我保存对源面板中的文件所做的任何更改但我想知道是否可以自动保存对元素面板中对 CSS 所做的更改否则目前对元素面板中的样式所做的任何更改似乎只存在于此处我记得在某个
如何创建自定义文本转语音引擎

据我所知 TTS 需要 TTS 引擎才能说一种语言在 Android 模拟器 2 2 中默认使用 Pico TTS 引擎它只有一些流行语言我在市场上看到一些引擎必须购买才能安装我的问题有没有办法创建支持其他语言的自定义引擎通过
如何使 Application.Properties.Settings 公开并保持这种状态

我正在将我的应用程序设置集中到一个位置并且我选择使用公共库中的设置集合来执行此操作我已将所有这些设置移至它们自己的文件中该文件使用配置源拉入我的 app config 中
如何自动递增 varchar？

我可以在一张表中为供应商 s0001 s0002 创建一个主键例如 c0001 c0002 吗数据库设计的思想是保持每个数据元素独立每个元素都有自己的数据类型约束和规则那c0002不是一个字段而是两个字段与相同XXXnnn管他
ASP.NET 应用程序中的实体框架 ObjectContext 单元测试

我使用以下代码为每个 ASP NET 请求创建实体框架 ObjectContext public static class ObjectContextPerRequest public static EStudyTestDatabaseEn
如何使用 MVVM 模式“禁用”WPF 中的按钮？

我正在尝试掌握 WPF 和 MVVM 并取得了良好的进展 WPF 和 MVVM 方面进展顺利然而 XAML 和数据绑定方面则完全是另一回事了我将如何禁用按钮例如我的视图模型中有一个 CanClose 属性用于确定当前是否可以关
SwiftUI：无法将“Bool”类型的值转换为预期的参数类型“Binding”

为 SwiftUI 创建基于文本的游戏想知道为什么我无法在字符 ForEach 循环中访问 isSelected 它给出了错误无法将类型 Bool 的值转换为预期参数类型 Binding 在线上Toggle isOn character
为什么 const_cast 会删除指针的常量性，但不会删除指向 const 的指针？

我明白那个const cast使用指针和引用我假设输入const cast应该是一个指针或引用我想知道为什么如果输入是指针引用它不会消除常量性const int 以下代码按预期工作 const cast具有多级指针 int main
如何删除自动完成上的清除按钮并仅显示文本

我是反应虚拟化和自动完成的新手我目前已经构建了一个列表当选中该复选框时该列表会显示多个文本这是我的代码 https codesandbox io s material demo forked 1qzd3 file demo tsx
Django：限制模型数据

我正在以一种限制可以通过模型获得的查询集的方式进行搜索假设我有以下模型具有依赖项 Company Section Employee Task more models Customer Contract Accounts other gr
使用 dict.values() 或 dict.itervalues() 迭代时修改字典值

我有一个像这样初始化的字典 tab Mike 0 Chad 15 Taylor 2 我希望能够将整数添加到字典中的每个值例如添加 5 后字典应如下所示 Mike 5 Chad 20 Taylor 7 似乎这可以通过几行代码来完成但我
mvc视图中模型空引用异常

问题是从控制器传递数据到视图时出现空引用异常我将模型从控制器传递到视图如下所示 ViewBag PartId id var viewmodel new Orderviewmodelnew var order new OrderMnage
扩展 APDU 和 T=0/1 通信协议

我有一个 JCOP V2 4 2 R3 java 卡它的数据表中提到该卡支持T 1 and T 0通信协议我还有一个 ACR38 智能卡读卡器它支持 T 0 和 T 1 协议我与一张卡成功进行了 T 0 通信并且与该卡成功进行了
C# 中的 StreamReader 和缓冲区

我对 StreamReader 的缓冲区使用有疑问这里 http msdn microsoft com en us library system io streamreader aspx http msdn microsoft com e
如何让 Polymer 2.0 ES5 元素与 v1 规范一起工作？

我已经成功构建了许多 Polymer 2 0 元素它们在支持 ES6 的浏览器中运行良好当我尝试将它们转换为 ES5 时浏览器会抛出一堆错误如下所示 Failed to construct HTMLElement Please us
哪些 Web 浏览器支持通过 HTML5 进行地理定位？

哪些网络浏览器和版本支持通过 HTML5 进行地理定位在桌面上仅支持 Firefox 不确定 Opera 是否已将其包含在官方版本中在移动设备上 mobile safari 3 和 android 2 x 浏览器有关支持的更多信息
使用 python 以字节块的形式读取文件

我正在尝试将包含超过 10 亿字节的文件转换为整数显然我的机器无法立即执行此操作因此我需要对代码进行分块我能够解码前 50 000 000 个字节但我想知道如何读取文件中介于 50 000 001 和 100 000 000 15

使用 python 以字节块的形式读取文件

使用 python 以字节块的形式读取文件 的相关文章

随机推荐

热门标签

使用 python 以字节块的形式读取文件的相关文章