删除完整磁盘上最旧的文件

2024-01-06

一个以 100MB 块将数据写入磁盘并通过附加 +1 来增加文件名的应用程序，因此n1, n2 ... n1000。这最终会使用分区（Linux 主机）上的所有可用空间。我正在寻找一种方法来删除该系列中首次写入的文件，直到驱动器空间达到特定利用率。

如果是后者的话，会https://stackoverflow.com/a/5912404/666891 https://stackoverflow.com/a/5912404/666891是一个好的解决方案吗？

提出了以下解决方案，并且看起来是一个可行的解决方案https://stackoverflow.com/a/837840/666891 https://stackoverflow.com/a/837840/666891。如何修改它以处理递增的文件扩展名，因为当前脚本运行时它不会删除文件名 filename*，星号是递增的数字，从最旧的开始？

import os
def free_space_up_to(free_bytes_required="161061273600", rootfolder="/data/", ex
tension="filename-*"):
    file_list= files_to_delete(rootfolder, extension)
    while file_list:
        statv= os.statvfs(rootfolder)
        if statv.f_bfree*statv.f_bsize >= free_bytes_required:
            break
        os.remove(file_list.pop())

好吧，如果您知道所有文件的大小（至少有点）为 100MB，并且假设没有其他任何因素大幅改变计算机上的磁盘使用情况，则无需在每次迭代时检查可用空间。

另外，如果所有文件都具有相同的名称，除了末尾的计数器之外，您可以跳过 os.stat 调用（这对于快速连续创建的文件也可能无用）并根据计数器对文件名进行排序：

import os

def free_space_up_to(free_bytes_required=161061273600, rootfolder="/data/", filesize=104857600, basename="filename-"):
    '''Deletes rootfolder/basename*, oldest first, until there are free_bytes_required available on the partition.
    Assumes that all files have file_size, and are all named basename{0,1,2,3,...}
    Returns number of deleted files.
    '''
    statv = os.statvfs(rootfolder)
    required_space = free_bytes_required - statv.f_bfree*statv.f_bsize
    basepath = os.path.join(rootfolder, basename)
    baselen = len(basepath)
    if required_space <= 0:
        return 0

    # "1 +" here for quickly rounding
    files_to_delete = 1 + required_space/filesize

    # List all matching files. If needed, replace with os.walk for recursively
    # searching into subdirectories of rootfolder
    file_list = [os.path.join(rootfolder, f) for f in os.listdir(rootfolder)
                 if f.startswith(basename)]

    file_list.sort(key=lambda i: int(i[baselen:]), reverse=True)
    # Alternatively, if the filenames can't be trusted, sort based on modification time
    #file_list.sort(key=lambda i: os.stat(i).st_mtime)

    for f in file_list[:files_to_delete]:
        os.remove(f)
    return files_to_delete

（未经彻底测试，我建议进行测试运行，用“print”替换“os.remove”；））

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Wrapper

删除完整磁盘上最旧的文件的相关文章

蟒蛇 | MySQL | AttributeError：模块“mysql.connector”没有属性“connect”

我正在学习 python 中的一个新库 mysql 我尝试执行以下命令 import mysql connector mydb mysql connector connect host localhost user root passwd
如何在多进程系统中实现锁定？

我们正在并行运行许多詹金斯项目我们使用 python 并且选择使用 pyenv 管理虚拟环境不幸的是 pyenv 有一个众所周知的竞争条件 https github com yyuu pyenv issues 174 为了解决这个问题
如何避免使用 python 处理空的标准输入？

The sys stdin readline 返回之前等待 EOF 或新行所以如果我有控制台输入 readline 等待用户输入相反我想打印帮助并在没有需要处理的情况下退出并显示错误而不是等待用户输入原因我正在寻找一个Pytho
将非常大的Python列表输出保存到mysql表中

我想将 python 生成的列表的输出保存在 mysql 数据库的表中该表如下所示 mysql 中的 myapc8 表 https i stack imgur com 4B4Hz png这是Python代码在此输入图像描述 https
多处理中的动态池大小？

有没有办法动态调整multiprocessing Pool尺寸我正在编写一个简单的服务器进程它会产生工作人员来处理新任务使用multiprocessing Process对于这种情况可能更适合因为工作人员的数量不应该是固定的但我需
在Python中从大文件中搜索单词列表

我是新蟒蛇我有一个单词列表和一个非常大的文件我想删除文件中包含单词列表中的单词的行单词列表按排序给出并且可以在初始化期间输入我正在努力寻找解决这个问题的最佳方法我现在正在进行线性搜索这花费了太多时间有什么建议么您可以使用i
创建上下文后将 jar 文件添加到 pyspark

我正在笔记本上使用 pyspark 并且不处理 SparkSession 的创建我需要加载一个包含一些我想在处理 rdd 时使用的函数的 jar 您可以使用 jars 轻松完成此操作但在我的特定情况下我无法做到这一点有没有办法访问sp
使用 Paramiko 进行 DSA 密钥转发？

我正在使用 Paramiko 在远程服务器上执行 bash 脚本在其中一些脚本中存在与其他服务器的 ssh 连接如果我只使用 bash 不使用 Python 我的 DSA 密钥将被第一个远程服务器上的 bash 脚本转发并使用以连接
在 python pandas 中，如何保存“网格图”？

我对 pandas 绘图工具很陌生在文档中以下命令非常方便 myplot rts ret hist bins 50 by rts primary mic 然而当我尝试从图中获取图形参考并保存它时问题就出现了 myfigure myp
AttributeError：“模块”对象没有属性[重复]

这个问题在这里已经有答案了我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
查找 Pandas DF 行中的最短日期并创建新列

我有一个包含多个日期的表有些日期将为 NaN 我需要找到最旧的日期所以一行可能有 DATE MODIFIED WITHDRAWN DATE SOLD DATE STATUS DATE 等因此对于每一行一个或多个字段中都会有一个日期
Airflow 1.9 - 无法将日志写入 s3

我在 aws 的 kubernetes 中运行气流 1 9 我希望将日志发送到 s3 因为气流容器本身的寿命并不长我已经阅读了描述该过程的各种线程和文档但我仍然无法让它工作首先是一个测试向我证明 s3 配置和权限是有效的这是在我们
使用 Python 将连续日期分组在一起

Given dates datetime 2014 10 11 datetime 2014 10 1 datetime 2014 10 2 datetime 2014 10 3 datetime 2014 10 5 datetime 201
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
如何指示 urwid 列表框的项目数多于当前显示的项目数？

有没有办法向用户显示 urwid 列表框在显示部分上方下方有其他项目我正在考虑类似滚动条的东西它可以显示条目的数量或者列表框顶部底部的单独栏如果这个行为无法实现有哪些方法可以实现这个通知在我的研究过程中我发现这个问题 ht
如何将带有参数的Python装饰器实现为类？

我正在尝试实现一个接受一些参数的装饰器通常带有参数的装饰器被实现为双重嵌套闭包如下所示 def mydecorator param1 param2 do something with params def wrapper fn def
minizinc python 安装

我通过 anaconda 提示符在 python 上安装了 minizinc 就像其他软件包一样 pip install minizinc 该软件包表示已成功安装我可以导入该模块但是我正在遵循基本示例https minizinc py
如何给URL添加变量？

我正在尝试从网站收集数据我有一个 Excel 文件其中包含该网站的所有不同扩展名 F i www example com example2 我有一个脚本可以成功从网站中提取 HTML 但现在我想为所有扩展自动执行此操作然而当我说 s
pandas 中数据帧中的随机/洗牌行

我目前正在尝试找到一种方法来按行随机化数据框中的项目我在 pandas 中按列洗牌排列找到了这个线程在 pandas 中对 DataFrame 进行改组排列 https stackoverflow com questions 157
如何（安全）将 Python 对象发送到我的 Flask API？

我目前正在尝试构建一个 Flask Web API 它能够在 POST 请求中接收 python 对象我使用 Python 3 7 1 创建请求使用 Python 2 7 运行 API 该 API 设置为在我的本地计算机上运行我试图发

随机推荐

scipy.optimize.minimize('SLSQP') 给定 2000 个暗淡变量时太慢

我有一个带有约束和上下界的非线性优化问题所以使用 scipy 我必须使用 SLSQP 问题显然不是凸的我让雅可比函数的目标函数和约束函数都能正常工作结果很好快最多 300 个输入向量所有功能均经过矢量化并调整为运行速度非常快
c# 会话“未将对象引用设置为对象的实例。”

我有一个 ASHX 文件对象引用未设置为对象的实例在线上 HttpContext Current Session loggedIn true 这是我正确使用会话的方式吗我猜想Session是这里的罪魁祸首供参考here https
Play Framework 以及模型类中集合的使用

我刚刚开始使用 Play 框架在我的模型类之一中使用集合时遇到了一些问题我对 Play 和 JPA Hibernate 非常陌生所以请原谅我的菜鸟我尝试在网络上搜索答案但找不到我想要的东西本质上我有 2 个模型 Entity
如何使用 Kotlin 反射更改成员字段？

我正在将一个类从 Java 移植到 Kotlin 这个类声明了数百个对象每个对象都有一个 name 属性该属性与该对象声明的变量名称相同 Java反射允许通过反射使用声明的名称来设置对象成员name 只是在数百个构造函数中保存一个参数
“JScript - 脚本块”和内存泄漏 - 如何正确释放资源？

我在项目的部分视图中放置了一些 jquery 选项卡我通过 Visual Studio 的解决方案资源管理器注意到在调试期间新动态JScript script block每次我单击新选项卡时都会生成即使我把这种情况发生 mytab
视图正在剪切其内容错误

我使用的是 Xcode 4 6 在窗口中我不断收到视图正在裁剪其内容错误当我单击它时 XIB 编辑器会突出显示一个标签这个错误试图告诉我什么以及如何修复它首先单击文本视图正在裁剪将选择有问题的控件当您将文本字段的大小调整
Javascript 通过类或 id 获取 DOM 数组中的元素索引位置

我的情况 var domElements document body getElementsByTagName 现在我想返回数组项键数组中元素的位置例如domElements 34 在数组中搜索元素id asd 我怎样才能实现这个目标
将 Ehcache CacheManager (v 3.x) 转换为 Spring CacheManager，无需 XML 配置

我正在尝试在我的应用程序中使用 Ehcache 管理器我想在没有 xml 配置的情况下设置它我有下一个依赖项
头文件的多次包含[重复]

这个问题在这里已经有答案了 I have A cpp and B cpp两者都包含头文件header h 后来两者A cpp and B cpp包含在一个main cpp 这会导致错误当main cpp编译时说头文件header h已被收
python 用高斯混合模型（GMM）拟合加权数据，协方差最小

我想使用 python 将高斯混合模型拟合到一组加权数据点我尝试了 sklearn mixture GMM 它工作得很好除了它对所有数据点的权重相等有谁知道如何在此方法中为数据点分配权重我多次尝试使用数据点来增加其权重但这对于大
如何将源代码嵌入到 pdb 中并让调试器使用它？

NOTE 我的目标关注点是 C 以常规 MSIL 为目标的 CLR 以防有一些东西适用于此但不适用于更一般的情况我读过这篇文章并想总结一下我的理解以便清楚起见如今调试器使用 PDB 来获取文件的磁盘路径以及编译后创建可执行文件的给定
使用带有圆形文本框的图标 Bootstrap 4 搜索输入

我想要带有搜索图标的圆形边框搜索框下面的代码有效但如果我将其分类为 rounded pill 则图标将与文本框分开如何使文本框变圆同时图标也保留在其中
R - 条件滞后 - 如何滞后一定数量的单元格直到满足条件？

几周来一直试图解决这个问题但似乎无法解决我有以下数据框 post id user id 1 post 1 user1 2 post 2 user2 3 comment 1 user1 4 comment 2 user3 5 commen
无法在 PayPal HTMLButton 上指定每个付款请求的“金额”

我正在尝试使用 HTML 按钮方法与 PayPal 集成结帐流程相当简单用户点击立即购买 gt 转入 PayPal gt 付款处理 gt 返回网站根据客户想要立即购买的商品提交的表单中的金额会有所不同并且我无法让 Pa
如何使用 MVC Web Api 内容服务器和 Android 最终用户 apk 实现 OWIN 身份验证服务器

我正在尝试实施用于按需返回内容的 MVC Web API 服务器 REST 服务器中央身份验证 OAuth 2 0 服务器例如 OWIN Android 最终用户端应用程序场景是这样的 Android应用程序在REST服务器上请求内
使用 node.js 在 Azure 文件存储中上传文件

我们正在尝试创建一个 Web 服务以使用 node js 服务将文件上传到 Azure 文件存储下面是node js服务器代码 exports post function request response var shareName r
为什么 PRIVATE 成员函数不能成为另一个类的友元函数？

class x void xx class y friend void x xx 这会导致类似的错误错误友元函数 xx 是 x 的私有成员为什么我不能将私有成员函数声明为另一个类的友元同学朋友 9 http eel is c dr
iOS AppStore 上的 CCATS 和加密

这将是一个很长的问题实际上是一组相关的问题我想制作一个 iOS 应用程序将在 Apple 的 App Store 上出售显然我的应用程序将在文档目录中存储一些敏感的用户数据出于安全原因我想到了一种可以保护该数据的加密系统有趣
所得税计算的编程逻辑

谁能帮我为我们的办公室员工工资税表创建 PHP 或 mysql 代码这是我们税收监管的基础 If salary is gt 0 and lt 150 it will be 0 Nill If salary is gt 151 and lt
删除完整磁盘上最旧的文件

一个以 100MB 块将数据写入磁盘并通过附加 1 来增加文件名的应用程序因此n1 n2 n1000 这最终会使用分区 Linux 主机上的所有可用空间我正在寻找一种方法来删除该系列中首次写入的文件直到驱动器空间达到特定利用率如果

删除完整磁盘上最旧的文件

删除完整磁盘上最旧的文件 的相关文章

随机推荐

热门标签

删除完整磁盘上最旧的文件的相关文章