对 os.listdir 文件进行排序 Python

2024-05-15

如果已下载数年的数据，这些数据存储在具有以下命名约定的文件中：year_day.dat。例如，名为 2014_1.dat 的文件包含 2014 年 1 月 1 日的数据。我需要按天排序读取这些数据文件，2014_1.dat、2014_2.dat、2014_3.dat 直到年底。在按顺序列出的文件夹中，但是当我在目录中创建文件列表时，它们会重新排序2014_1.dat、2014_10.dat、2014_100.dat、2014_101.dat...2014.199.dat、2014_2.dat。我想我需要使用排序功能，但是如何强制它按天对列出的文件进行排序，以便我可以继续处理它们？这是到目前为止的代码：

import sys, os, gzip, fileinput, collections
# Set the input/output directories
wrkDir = "C:/LJBTemp"
inDir = wrkDir + "/Input"
outDir = wrkDir + "/Output"
# here we go
inList = os.listdir(inDir)  # List all the files in the 'Input' directory
print inList  #print to screen reveals 2014_1.dat.gz followed by 2014_10.dat.gz NOT    2014_2.dat.gz HELP
d = {}
for fileName in inList:     # Step through each input file 
    readFileName = inDir + "/" + fileName

    with gzip.open(readFileName, 'r') as f: #call built in utility to unzip file for reading
      for line in f:
          city, long, lat, elev, temp = line.split() #create dictionary
          d.setdefault(city, []).append(temp) #populate dictionary with city and associated temp data from each input file
          collections.OrderedDict(sorted(d.items(), key=lambda d: d[0])) # QUESTION? why doesn't this work
          #now collect and write to output file
outFileName = outDir + "/" + "1981_maxT.dat" #create output file in output directory with .dat extension
with open(outFileName, 'w') as f:
     for city, values in d.items():
        f.write('{} {}\n'.format(city, ' '.join(values)))

print "All done!!"
raw_input("Press <enter>") # this keeps the window open until you press "enter"

如果您不介意使用第三方库，您可以使用natsort https://github.com/SethMMorton/natsort库，正是针对这种情况而设计的。

import natsort
inList = natsort.natsorted(os.listdir(inDir))

这应该处理所有的数字排序，而不必担心细节。

您还可以使用ns.PATH使排序算法具有路径感知能力的选项：

from natsort import natsorted, ns
inList = natsorted(os.listdir(inDir), alg=ns.PATH)

完全公开，我是natsort author.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

对 os.listdir 文件进行排序 Python 的相关文章

TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
golang中如何将相对路径解析为绝对路径？

节点中是否有类似 path resolve 的API 或者有什么东西可以做同样的事情例如 nodejs代码 path resolve sample sh 应该得到 home currentuser sample sh 解决表示用户主目录
Tweepy StreamListener 到 CSV

我是 python 新手我正在尝试开发一个应用程序使用 Tweepy 和 Streaming API 从 Twitter 检索数据并将数据转换为 CSV 文件问题是此代码不会创建输出 CSV 文件也许是因为我应该将代码设置为在实现例
查找模块中显式定义的函数 (python)

好的我知道您可以使用 dir 方法列出模块中的所有内容但是有什么方法可以仅查看该模块中定义的函数吗例如假设我的模块如下所示 from datetime import date datetime def test return Thi
如何将 self 传递给装饰器？

我该如何通过self key下面进入装饰器 class CacheMix object def init self args kwargs super CacheMix self init args kwargs key func Cons
python 中的 Johansen 协整检验

我找不到任何有关在处理统计和时间序列分析 pandas 和 statsmodel 的 Python 模块中执行 Johansen 协整检验的功能的参考有谁知道是否有一些代码可以执行时间序列之间的协整测试现在这已在 Python 的 s
Apache Spark 中的高效字符串匹配

我使用 OCR 工具从屏幕截图中提取文本每个大约 1 5 句话然而当手动验证提取的文本时我注意到时不时会出现一些错误鉴于文本你好我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被替换 2 表情符号未被正确提
PyMC3-自定义 theano Op 进行数值积分

我使用 PyMC3 进行参数估计使用必须定义的特定似然函数我用谷歌搜索了一下发现我应该使用densitydist实现用户定义的似然函数的方法但它不起作用如何在 PyMC3 中合并用户定义的似然函数并找出最大 aposteriori
按扩展名过滤搜索文件返回太多结果

我正在开发一个 C 控制台应用程序它必须管理 Windows 操作系统上的文件我需要获取具有特定扩展名的文件名列表我找到了很多解决方案最建议的是以下一种 HANDLE hFind WIN32 FIND DATA data hFin
为什么我无法在 Mac OS X Terminal.app 上的 Python 解释器中显示 unicode 字符？

如果我尝试粘贴 unicode 字符例如中间的点在我的 python 解释器中它什么也不做我在 Mac OS X 上使用 Terminal app 当我只是在 bash 中时我没有遇到任何问题但在解释器中 python Pytho
如何使用 Django 项目设置 SQLite？

我已阅读 Django 文档仅供参考 https docs djangoproject com en 1 3 intro tutorial01 https docs djangoproject com en 1 3 intro tutor
与 while 循环一样，如何跳过 for 循环中的步骤？

我尝试像 while 循环一样跳过 for 循环中的几个步骤在 while 循环中步骤根据特定条件进行调整如下面的代码所示 i 0 while i lt 10 if i 3 i 5 else print i i i 1 result
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
如何使用 sys.path.append 在 Python 中导入文件？

我的桌面上有两个目录 DIR1 and DIR2其中包含以下文件 DIR1 file1 py DIR2 file2 py myfile txt 这些文件包含以下内容 file1 py import sys sys path append s
是否可以将 pd.Series 分配给无序 pd.DataFrame 中的列而不映射到索引（即不重新排序值）？

在 Pandas 中创建或分配新列时我发现了一些意外的行为当我对 pd DataFrame 进行过滤或排序从而混合索引然后从 pd Series 创建新列时 Pandas 会重新排序该系列以映射到 DataFrame 索引例如 d
如何解压 msgpack 文件？

我正在将 msgpack 编码的数据写入文件在编写时我只是使用 C API 的 fbuffer 如我为示例删除了所有错误处理 FILE fp fopen filename ab msgpack packer pk msgpack pa
处理大文件的最快方法？

我有多个 3 GB 制表符分隔文件每个文件中有 2000 万行所有行都必须独立处理任何两行之间没有关系我的问题是什么会更快逐行阅读 with open as infile for line in infile 将文件分块读入内存
Pandas - 合并数据框以将所有值保留在左侧，如果“左侧没有键”，则从右侧“插入”值，否则“更新”左侧现有的“键”

我有两个数据框 df1 和 df2 np random seed 0 df1 pd DataFrame key A B C D id 2 23 234 2345 2021 np random randn 4 df2 pd DataFrame
Python 通过从现有 csv 文件中过滤选定的行来写入新的 csv 文件

只是一个问题我试图将 csv 文件中的选定行写入新的 csv 文件但出现错误我试图读取的 test csv 文件是这样的两列 2013 9 1 2013 10 2 2013 11 3 2013 12 4 2014 1 5 2014
在 Django shell 会话期间获取 SQL 查询计数

有没有办法打印 Django ORM 在 Django shell 会话期间执行的原始 SQL 查询的数量 Django 调试工具栏已经提供了此类信息例如 5 QUERIES in 5 83MS但如何从 shell 中获取它并不明显您可

随机推荐

为 Windows 98 编译 Qt

我需要支持 Windows 98 Qt 文档声称这是可能的但没有说明 Qt 4 6 的分布式二进制文件不能在 Win98 上运行而且我采样的大多数 Qt 应用程序也不能在 Win98 上运行对于几个确实在 98 上运行的应用程序我询
带路径压缩算法的加权 Quick-Union

有一种带路径压缩的加权快速联合算法代码 public class WeightedQU private int id private int iz public WeightedQU int N id new int N iz new
动态创建和下载Doc文件

因此我尝试动态创建 doc 文件并让用户在单击按钮时下载该文件这些是我找到的用于下载文件的标头 header Content Description File Transfer header Content Type applicati
paymentId 和 TRANSACTIONID 之间的区别

我正在从 REST 转向经典 API 而且我对两者都是新手作为一名开发人员我想记录付款的唯一标识符以便将网站中的销售与 Paypal 付款 ID 相关联例如我想要退款时 REST API 曾经给我付款 ID https stacko
如何将列中的天数添加到 DB2 中的当前日期？

我正在编写此 SQL 来动态计算一定的天数如下所示但我不知道如何让它工作因为我不断收到错误 select Current Date Dynamic numbr of days calculation here from TableNa
使用一次递归调用实现递归

给定一个函数如下 f n f n 1 f n 3 f n 4 f 0 1 f 1 2 f 2 3 f 3 4 我知道使用递归来实现它并在一个函数内进行三个递归调用但我想在函数内仅使用一次递归调用来完成此操作怎样才能做到呢要实现使用
DataGridView 使用 Structure 和 LINQ 来排序 txt 文件

当我的程序出现问题时我能够将所有数据拉入网格并进入正确的列行但是我相信我的 LINQ 查询是错误的它没有使第三列正确划分并插入正确的数据我的结果 https gyazo com 0f307a10dff4c015a361708ec
使用 Mock 对 Laravel 5 Mail 进行单元测试

有没有办法在 Laravel 5 中测试 Mail 尝试了我在互联网上看到的唯一合法的模拟示例但它似乎只适用于 Laravel 4 下面的当前代码 mock Mockery mock Swift Mailer this gt app ma
反转js对象中的键值

我不知道如何改变 first de second ab de third de to de first second third ab second 我想将唯一值与包含键的列表相关联我尝试过的但我认为我离它还很远 const data
将具有值的产品属性添加到 Woocommerce 中的产品

我正在使用此代码添加自定义属性 attributes array array name gt Size options gt array S L XL XXL position gt 1 visible gt 1 variation gt
编码杂志[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
opc ua客户端到服务器

我想知道是否可以将数据从 OPC UA 客户端发送到服务器我有一台设置了 OPC UA 服务器的 Windows 10 PC 和一些 Raspberry Pi 作为客户端我已经编写了 Python 代码来将数据从服务器发送到客户端现在
C++，set_terminate 是每个线程本地的吗？

Should set terminate get terminate在 C 2011 或 C 2003 中为多个线程设置不同的终止异常处理器例如如果我有程序并将终止处理程序设置为func 1 然后我启动3个线程新线程中的终止处理程序是
PayPal 定期付款：如何添加初始付款。

我一直在使用实现一个功能可以使用 PayPal 进行定期付款并发送此请求复制自https developer paypal com webapps developer docs api create a plan https deve
如何使 FirebaseAuth.AuthStateListener 在 Kotlin 中工作？

class LoginActivity AppCompatActivity private val firebaseAuth FirebaseAuth getInstance private val firebaseAuthListener
读取混合（即文本和二进制）数据的最佳方法是什么？

我需要能够读取混合二进制和非二进制数据的文件格式假设我知道输入是好的那么最好的方法是什么作为示例我们以一个文件为例该文件的第一行是 double 换行符 0x0D 0x0A 后面是十个字节的二进制数据当然我可以计算换行符的位置
如何查询集成服务目录

问题识别连接到 SQL Server 上特定数据库表的所有 SSIS 包详细信息服务器上部署了近 100 个包大多数包的大小都很大因此很难以高精度手动检查它们有没有一种快速且自动化的方法来做到这一点使用 SQL Server
java中监视目录变化

我正在使用 WatchService 来监视目录中的更改特别是目录中新文件的创建下面是我的代码 package watcher import java nio file import static java nio file Stand
对 os.listdir 文件进行排序 Python

如果已下载数年的数据这些数据存储在具有以下命名约定的文件中 year day dat 例如名为 2014 1 dat 的文件包含 2014 年 1 月 1 日的数据我需要按天排序读取这些数据文件 2014 1 dat 2014 2 d

对 os.listdir 文件进行排序 Python

对 os.listdir 文件进行排序 Python 的相关文章

随机推荐

热门标签