当使用 Python 处理一个巨大的 CSV 并突然停止时，“killed”是什么意思？

2023-12-04

我有一个 Python 脚本，它导入一个大型 CSV 文件，然后计算文件中每个单词的出现次数，然后将计数导出到另一个 CSV 文件。

但正在发生的事情是，一旦计数部分完成并开始导出，它就会说Killed在终端中。

我不认为这是一个内存问题（如果是的话，我认为我会遇到内存错误，而不是Killed).

会不会是这个过程花费的时间太长了？如果是这样，有没有办法延长超时时间以避免这种情况？

这是代码：

csv.field_size_limit(sys.maxsize)
    counter={}
    with open("/home/alex/Documents/version2/cooccur_list.csv",'rb') as file_name:
        reader=csv.reader(file_name)
        for row in reader:
            if len(row)>1:
                pair=row[0]+' '+row[1]
                if pair in counter:
                    counter[pair]+=1
                else:
                    counter[pair]=1
    print 'finished counting'
    writer = csv.writer(open('/home/alex/Documents/version2/dict.csv', 'wb'))
    for key, value in counter.items():
        writer.writerow([key, value])

And the Killed发生在之后finished counting已打印，完整消息为：

killed (program exited with code: 137)

退出代码137（128+9）表示你的程序由于接收到信号9而退出，即SIGKILL。这也解释了killed信息。问题是，为什么你会收到这个信号？

最可能的原因可能是您的进程超出了允许您使用的系统资源量的某些限制。根据您的操作系统和配置，这可能意味着您打开了太多文件，使用了太多文件系统空间或其他原因。最有可能的是您的程序使用了太多内存。当内存分配开始失败时，系统不会冒着崩溃的风险，而是向使用过多内存的进程发送终止信号。

正如我之前评论的，打印后可能会达到内存限制的原因之一finished counting这是你的电话吗counter.items()在最后的循环中分配一个包含字典中所有键和值的列表。如果您的字典有大量数据，这可能是一个非常大的列表。一个可能的解决方案是使用counter.iteritems()这是一个发电机。它不是返回列表中的所有项目，而是让您以更少的内存使用量迭代它们。

所以，我建议尝试这个，作为你的最后一个循环：

for key, value in counter.iteritems():
    writer.writerow([key, value])

请注意，在 Python 3 中，items返回一个“字典视图”对象，它的开销与 Python 2 的版本不同。它取代了iteritems，因此如果您以后升级 Python 版本，您最终会将循环更改回原来的方式。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

当使用 Python 处理一个巨大的 CSV 并突然停止时，“killed”是什么意思？的相关文章

切片稀疏（scipy）矩阵

我将不胜感激任何帮助以理解从 scipy sparse 包中切片 lil matrix A 时的以下行为实际上我想根据行和列的任意索引列表提取子矩阵当我使用这两行代码时 x1 A list 1 x2 x1 list 2 一切都很好
即使页面未完全加载，我们也可以使用 Selenium 获取页面源吗（TimeoutException: Message: timeout）？

即使遇到 TimeoutException Message timeout 也能获取页面源码吗当我调用 driver page source 时有时无法加载整页但我只需要它的部分信息尚未确定所以我只想在任何情况下保存页面是否可以
Python 2.7 将比特币私钥转换为 WIF 私钥

作为一名编码新手我刚刚完成了教程教程是这样的 https www youtube com watch v tX XokHf nI https www youtube com watch v tX XokHf nI 我想用 1 个易于阅读
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
在 macOS 中通过 Python 访问进程的压缩 RAM（顶部的 CMPRS）的方法？

我试图弄清楚如何从 Python 访问任何给定进程占用的实际 RAM 量我发现 psutil Process PID memory info rss 工作得很好直到操作系统决定开始压缩某些进程的 RAM 然后所有的 memory in
当单词以“|”分隔时如何读取文件（埃因霍温）？

在Python中我有一个文件其中的单词由例如 city state zipcode 我的文件阅读器无法区分单词另外我希望我的文件阅读器从第 2 行而不是第 1 行开始如何让我的文件阅读器分隔单词 import os import
如何在 Python 3 中循环遍历集合，同时从集合中删除项目

这是我的情况我有一个list set 哪个并不重要 movieplayer我想调用的对象 preload 功能开启该预加载函数可以立即返回但希望将来返回一点我想存储这个电影播放器集合表明它们尚未预加载然后循环它们调用prel
更改 python tkinter canvas 中的线坐标

我画了一条线tkinter Canvas现在我想移动一端这可能吗例如和itemconfig import tkinter tk tkinter Tk canvas tkinter Canvas tk canvas pack line c
Python Fabric - 未找到主机。请指定用于连接的（单个）主机字符串：

如何获取找不到主机请指定用于连接的单个主机字符串面料如何解决 def bootstrap host ec2 54 xxx xxx xxx compute 1 amazonaws com env hosts host env use
使用 scipy curve_fit 拟合噪声指数的建议？

我正在尝试拟合通常按以下方式建模的数据 def fit eq x a b c d e return a 1 np exp x b c np exp x d e x np arange 0 100 0 001 y fit eq x 1 1 1
Apache Spark 中的高效字符串匹配

我使用 OCR 工具从屏幕截图中提取文本每个大约 1 5 句话然而当手动验证提取的文本时我注意到时不时会出现一些错误鉴于文本你好我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被替换 2 表情符号未被正确提
为什么我无法在 Mac OS X Terminal.app 上的 Python 解释器中显示 unicode 字符？

如果我尝试粘贴 unicode 字符例如中间的点在我的 python 解释器中它什么也不做我在 Mac OS X 上使用 Terminal app 当我只是在 bash 中时我没有遇到任何问题但在解释器中 python Pytho
与 while 循环一样，如何跳过 for 循环中的步骤？

我尝试像 while 循环一样跳过 for 循环中的几个步骤在 while 循环中步骤根据特定条件进行调整如下面的代码所示 i 0 while i lt 10 if i 3 i 5 else print i i i 1 result
乘以行并按单元格值附加到数据框

考虑以下数据框 df pd DataFrame X a b c d Y a b d e Z a b c d 1 2 1 3 df 我想在列中附加数字大于 1 的行并在该行中的数字减 1 df 最好应该然后看起来像这样或者它可能看起来
具有屏蔽无效值的 pcolormesh

我试图将一维数组绘制为 pcolormesh 因此颜色沿 x 轴变化但每个 x 的 y 轴保持不变但我的数据有一些错误值因此我使用屏蔽数组和自定义颜色图其中屏蔽值设置为蓝色 import numpy as np import mat
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
无法在 python 3.8 上将带有 webapp 的 python 部署到 azure

我正在尝试使用部署一个测试项目Flask使用以下方法将框架迁移到 Azure 云中Azure CLI https learn microsoft com en us azure app service containers quicksta
如何使用 Keras ImageDataGenerator 预测单个图像？

我已经训练 CNN 对图像进行 3 类分类在训练模型时我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它现在我的网络在测试集上训练得非常准确但我不知道如何在单图像预测上应用预处理功能如
是否可以将 pd.Series 分配给无序 pd.DataFrame 中的列而不映射到索引（即不重新排序值）？

在 Pandas 中创建或分配新列时我发现了一些意外的行为当我对 pd DataFrame 进行过滤或排序从而混合索引然后从 pd Series 创建新列时 Pandas 会重新排序该系列以映射到 DataFrame 索引例如 d

随机推荐

垂直连接制表符分隔的 txt 文件

input1 input2 output 是制表符分隔的 txt 文件如果输入1是 a b c 1 2 3 输入2是 e r t 那么我希望输出是 a b c 1 2 3 e r t 我尝试通过学习使用 python 连接文件Python
MongoRepository JSON 日期查询 (Spring)

我正在尝试使用自己的查询来查询 mongo 存储库 Repository public interface LogEntryRepository extends MongoRepository
了解 libx264 输出 [关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案我在 ffmpeg 中使用 libx264 进行编码最后我得到了以下输出谁能指导我理解和解释这一点有任何参考文档吗 01 01 06 34 43 650 I stderr 6
迭代包含嵌套数组的 pandas 数据框列

我希望你能帮我解决这个问题我在下面有这些数据列名称随便 data file0090 84 55 189 248 100 18 68 115 88 file6565 86 58 189 24 10 118 68 11 8 我需要将第 0
Celery 单元测试重试

我目前正在为我的 celery 任务编写单元测试并想测试我的任务是否正在重试注意 ALWAYS EAGER 在测试设置中设置为 True app shared task bind True soft time limit 600 aut
Arduino 频率为 11.0592MHz。修改Timer0、delayMicroseconds()

我在 Arduino 环境中使用 11 0592MHz 的 ATMega328P 我发现delayMicroseconds 函数快了大约27 原因是 wiring c 中的代码假设时钟速度现在为 8MHz 现在我尝试修复它我发现了不同的帖
如何安装本地 gem？

如果我将 gem 文件下载到计算机中的某个文件夹中我可以稍后使用它进行安装吗gem install 另外您可以使用gem install local path to gem filename gem 这将跳过您离开时发生的通常的 gem
从 VBA 调用 Python 脚本

我在 Excel 中从 vba 调用 python 脚本时遇到问题我阅读了解决相同问题的其他线程但是当我运行代码时 Python 屏幕闪烁然后消失仅供参考我下载了适用于 Windows 10 的 python 3 6 5 并将其添
使用 JavaScript 中的 Dart 类

我有一个 Dart 类 foo dart class Foo void talk print Hello 将 foo dart 编译为 JavaScript 后我希望能够像这样使用 Foo var foo new Foo from fo
java.lang.NoClassDefFoundError：org/apache/commons/lang/Validate

为什么会发生以下情况以及如何解决 Exception in thread main java lang NoClassDefFoundError org apache commons lang Validate at org jsoup D
Pygame 如何修复“尾随像素”？

在图像中红色轨迹是当我在精灵周围添加边界矩形时 pygame 创建的轨迹精灵也可以做到这一点最简单的解决方案是在每次重绘后将表面清除为黑色然而尝试在整个主表面上这样做并不是一个好主意我怎样才能解决这个问题通常你会这样做 def
Java 中 for 循环转换为 while 循环

我需要将这个 for 循环转换为 while 循环这样我就可以避免使用中断 double array new double 100 Scanner scan new Scanner System in for int index 0 in
单击 Facebook 通知后应用程序启动时，请求 ID 不可用

Facebook 应用程序是使用 iOS 本机应用程序设置的并使用另一个应用程序的捆绑 ID 和应用商店 ID 启用在当前情况下以下是可能的 1 向朋友发送应用程序请求 2 请求徽章出现在好友的Facebook中 3 单击请求将启动我
ftplib.error_perm: 553 无法创建文件。（Python 2.4.4）

我正在写入我要通过 FTP 访问的用户的主目录因此权限应该不是问题 FTP 在 FileZilla 中运行我检查了 vsftp conf 并做了local enable YES change On a Debian4使用 Python
在 Angular2 中设置选定的属性

我有选择组我想为具有特定 id 的对象设置选定属性我试图在功能上改变这种情况但没有帮助即使我只是简单地设置 attr selected true 这也没有帮助 div class form group div
检查给定区域中是否存在包含 4 个顶点的点

指的是http www weather gov directives sym pd01008006curr pdf 第 8 页我们在地理坐标系纬度和经度系统中给出了一个具有四个顶点的区域我想检查该区域内是否存在具有特定纬度和经度的点
Application Insights 如何跟踪 User_Id？

我正在运行具有应用程序洞察力的 Azure Web 应用程序我知道微软无法显示真实IP Client IP 所以我将真实IP地址添加到所有请求 Ip 我有一个访客 client id h9zbt 在过去 24 小时内使用 48 个不同的
更新后“主页”类别页面无法使用

版本 1 4 1 4 的 prestashop 网站正在与category php类别页面的文件不幸的是 1 6 0 6 的更新删除了该文件因为它已被视为已弃用 CMS 更新后 URL 结构发生变化后果之一是 URL 结构发生变化 f
Rails-4 中不区分大小写的活动记录查询

目前我正在 Rails 4 中的一个项目中工作其中我在 example com username 上有一个用户页面但如果我在正确的情况下使用用户名它只会找到记录如何在活动记录 Rails 中执行不区分大小写的搜索看看我下面的代码
当使用 Python 处理一个巨大的 CSV 并突然停止时，“killed”是什么意思？

我有一个 Python 脚本它导入一个大型 CSV 文件然后计算文件中每个单词的出现次数然后将计数导出到另一个 CSV 文件但正在发生的事情是一旦计数部分完成并开始导出它就会说Killed在终端中我不认为这是一个内存问题如果

当使用 Python 处理一个巨大的 CSV 并突然停止时，“killed”是什么意思？

当使用 Python 处理一个巨大的 CSV 并突然停止时，“killed”是什么意思？ 的相关文章

随机推荐

热门标签

当使用 Python 处理一个巨大的 CSV 并突然停止时，“killed”是什么意思？的相关文章