使用 Python 选择一列中具有特定范围值的行

2023-12-04

我知道这很简单，但我是 Python 的新用户，所以我在这里遇到了一些麻烦。顺便说一句，我正在使用 Python 3。

我有多个文件，看起来像这样：

姓名日期年龄性别颜色

Name Date Age Sex Color
Ray  May  25.1 M  Gray
Alex Apr  22.3 F  Green
Ann  Jun  15.7 F  Blue

（假设这是制表符分隔的。我应该补充一点，真实的文件将有大约 3,000 行和 17-18 列）

我想要做的是选择年龄列中的值小于 23 的所有行。

在此示例中，输出将是：

Name Date Age Sex Color
Alex Apr  22.3 F  Green
Ann  Jun  15.7 F  Blue

这是我尝试做的：

f = open("addressbook1.txt",'r')
line = f.readlines()
file_data =[line.split("\t")]
f.close()

for name, date, age, sex, color in file_data:
    if age in line_data < 23:
        g = open("college_age.txt",'a')
        g.write(line)
    else:
        h = open("adult_age.txt",'a')
        h.write(line)

现在，理想情况下，我有 20-30 个这样的“地址簿”输入文件，我希望这个脚本循环遍历所有这些文件，并将所有年龄在 23 岁以下的条目添加到同一个输出文件（“college_age.txt”）中。我真的不需要保留其他线路，但我不知道还能用它们做什么。

当我运行该脚本时，会生成错误。

AttributeError: 'list' object has no attribute 'split'

然后我将第三行更改为：

file_data=[line.split("\t") for line in f.readlines()]

它不再给我一个错误，而是什么也不做。它只是开始，然后开始。

有什么帮助吗？ :) 记住我对 Python 很笨。

我应该补充一点，我的实际数据有小数，而不是整数。我编辑了上面的数据以反映这一点。

这里的问题是你正在使用readlines()两次，意思是第一次读取数据，第二次就什么都没有了。

您可以直接迭代文件而不使用readlines()- 事实上，这是更好的方法，因为它不会立即读取整个文件。

虽然您可以通过使用来做您想做的事情str.split()正如你所拥有的，更好的选择是使用the csv module，这是专为该任务而设计的。

import csv

with open("addressbook1.txt") as input, open("college_age.txt", "w") as college, open("adult_age.txt", "w") as adult:
   reader = csv.DictReader(input, dialect="excel-tab")
   fieldnames = reader.fieldnames
   writer_college = csv.DictWriter(college, fieldnames, dialect="excel-tab")
   writer_adult = csv.DictWriter(adult, fieldnames, dialect="excel-tab")
   writer_college.writeheader()
   writer_adult.writeheader()
   for row in reader:
       if int(row["Age"]) < 23:
          writer_college.writerow(row)
       else:
          writer_adult.writerow(row)

那么我们在这里做什么？首先我们使用the with陈述 for 打开文件。它不仅更具Python风格和可读性，而且可以为您处理关闭，即使发生异常也是如此。

接下来我们创建一个DictReader从文件中读取行作为字典，自动使用第一行作为字段名称。然后，我们让编写器写回我们的拆分文件，并写入标头。使用DictReader这是一个偏好问题。它通常在您经常访问数据的情况下使用更多（并且当您不知道列的顺序时），但它使代码在这里易于阅读。但是，您可以只使用标准csv.reader().

接下来，我们循环遍历文件中的行，检查年龄（我们将其转换为 int，以便我们可以进行数值比较）以了解要写入哪个文件。这with声明为我们关闭了文件。

对于多个输入文件：

import csv

fieldnames = ["Name", "Date", "Age", "Sex", "Color"]
filenames = ["addressbook1.txt", "addressbook2.txt", ...]

with open("college_age.txt", "w") as college, open("adult_age.txt", "w") as adult:
   writer_college = csv.DictWriter(college, fieldnames, dialect="excel-tab")
   writer_adult = csv.DictWriter(adult, fieldnames, dialect="excel-tab")
   writer_college.writeheader()
   writer_adult.writeheader()
   for filename in filenames:
       with open(filename, "r") as input:
           reader = csv.DictReader(input, dialect="excel-tab")
           for row in reader:
               if int(row["Age"]) < 23:
                  writer_college.writerow(row)
               else:
                  writer_adult.writerow(row)

我们只需添加一个循环来处理多个文件。请注意，我还添加了字段名称列表。在我只使用文件中的字段和顺序之前，但由于我们有多个文件，我认为在这里这样做会更明智。另一种方法是使用第一个文件来获取字段名称。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Python 选择一列中具有特定范围值的行的相关文章

当我有自定义身份验证模型时，如何登录 Django Rest 可浏览 API？

我有一个自定义用户模型如下所示account models py from django contrib auth modles import AbstractUser from django db models signals impo
使用python查找txt文件中字母出现的次数

我需要从 txt 文件中读取该字母并打印 txt 文件中出现的次数到目前为止我已经能够在一行中打印内容但计数有问题有人可以指导吗 infile open grades txt content infile read for char
多处理中的动态池大小？

有没有办法动态调整multiprocessing Pool尺寸我正在编写一个简单的服务器进程它会产生工作人员来处理新任务使用multiprocessing Process对于这种情况可能更适合因为工作人员的数量不应该是固定的但我需
是否可以从 Julia 调用 Python 函数并返回其结果？

我正在使用 Python 从网络上抓取数据我想使用这些数据在 Julia 中运行计算是否可以在 Julia 中调用该函数并返回其结果或者我最好直接导出到 CSV 并以这种方式加载数据绝对地看PyCall jl https gith
从 Azure ML 实验中访问 Azure Blob 存储

Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块但是我需要将 JSON 文件写入 blob 存储由于没有模块可以执行此操作因此我尝试在Ex
协程从未被等待

我正在使用一个简单的上下文管理器其中包含一个异步循环 class Runner def init self self loop asyncio get event loop def enter self return self def e
类型错误：需要二进制或 unicode 字符串，得到 618.0

I ve been trying to implement this ML Linear Model into my dataset https www tensorflow org tutorials estimator linear L
Paste.httpserver 并通过 HTTP/1.1 Keep-alive 减慢速度；使用 httperf 和 ab 进行测试

我有一个基于paste httpserver 的Web 服务器作为HTTP 和WSGI 之间的适配器当我使用 httperf 进行性能测量时如果每次使用 num conn 启动一个新请求我每秒可以执行超过 1 000 个请求如果我使
使用 for 循环创建一系列元组

我已经搜索过但找不到答案尽管我确信它已经存在了我对 python 很陌生但我以前用其他语言做过这种事情我正在以行形式读取数据文件我想将每行数据存储在它自己的元组中以便在 for 循环之外访问 tup i inLine wher
两个不同长度的数据帧的列之间的余弦相似度？

我在 df1 中有文本列在 df2 中有文本列 df2 的长度将与 df1 的长度不同我想计算 df1 text 中每个条目与 df2 text 中每个条目的余弦相似度并为每场比赛给出分数输入样本 df1 mahesh suresh
从 Flask 运行 NPM 构建

我有一个 React 前端我想在与我的 python 后端 API 相同的源上提供服务我正在尝试使用 Flask 来实现此目的但我遇到了 Flask 找不到我的静态文件的问题我的前端构建是用生成的npm run build in s
给定一个排序数组，就地删除重复项，使每个元素仅出现一次并返回新长度

完整的问题我开始在线学习 python 但对这个标记为简单的问题有疑问给定一个排序数组就地删除重复项使得每个元素只出现一次并返回新的长度不分配另一个数组的额外空间您必须通过修改输入来完成此操作数组就地具有 O 1 额外内
是否需要关闭没有引用它们的文件？

作为一个完全的编程初学者我试图理解打开和关闭文件的基本概念我正在做的一项练习是创建一个脚本允许我将内容从一个文件复制到另一个文件 in file open from file indata in file read out file
Ubuntu systemd 自定义服务因 python 脚本而失败

希望获得有关 Ubuntu 中的 systemd 守护进程服务的一些帮助我写了一个 python 脚本来禁用 Dell XPS 上的触摸屏这更像是一个问题而不是一个有用的功能该脚本可以工作但我不想一直启动它这就是为什么我想到编写
在Raspberry pi上升级skimage版本

我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
使用另一个数据帧在数据帧中创建子列

我对 python 和 pandas 很陌生在这里我有一个以下数据框 did features offset word JAPE feature manual feature 0 200 0 aa 200 200 0 200 11 bf
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
带 Flask 的 RPI dht22：无法将第 4 行设置为输入 - 等待 PulseIn 消息超时

我正在尝试制作一个 Raspberry Pi 3 REST API 使用 DHT22 提供温度和湿度整个代码 from flask import Flask jsonify request from sds011 import SDS01
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome

随机推荐

内存映射文件有哪些优点？

我一直在研究一个项目的内存映射文件并且非常感谢以前使用过它们或决定不使用它们的人的任何想法为什么我特别担心以下问题按重要性排序并发性随机访问表现使用方便可移植性我认为优点实际上是与传统的读取文件方法相比减少了所需的数据
使用 PHPMailer 发送 unicode 表情符号

我正在尝试通过 PHPMailer 5 2 发送 unicode 表情符号但我发送的电子邮件收到的是奇怪的字符而不是表情符号我目前正在发送 HTML 电子邮件我刚刚echo包含一些 utf 8 表情符号的字符串并检查电子邮件源该字符
拖放多个文件的批处理文件？

我希望能够完成与下面类似的事情但是使用 pcutmp3 拖放多个文件的批处理文件我很难理解 Joey 所做的添加因为我通常不这样做但我想将多个文件 cue 放在一个批处理文件上并让它运行多次这就是批处理文件中的以下行发生 echo
致命错误：C 中超出了 30 秒的最大执行时间：[关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心我对这个错误感到非常震惊根本无法得到它 Fatal
返回 AsAsyncEnumerable() 时出现 ObjectDisposeException

在我的 NET Core 3 WebAPI 项目中我有以下简单的方法调用 HttpGet ViewerRoles public IAsyncEnumerable
如何实现链表的前置而不需要分配给新变量？

有人告诉我如何实现链表 enum List Cons u32 Box
如何在一行中增加或减少现有词典键的数值

在Java中可以增加或减少数值one line向 a 添加元素时HashMap 有没有办法在C 中做到这一点Dictionary 以Java为例 hashMap put key hashMap getOrDefault key 0 1 I
将 Android 库项目添加到 Eclipse 构建路径？

我有一个多模块 Android Maven 项目它由多个项目和一个 Android 库项目 baselib 组成我在其中运行非基于 Android 的 JUnit 测试只要我通过 Maven 运行测试就可以了当我使用 Run gt
在shinydashboard中动态创建可排序的menuSubItems

我有一个闪亮的应用程序使用shinydashboard我在其中动态创建的包menuSubItem是在sidebarMenu of a dashboardSidebar 子项的创建由操作按钮触发我可以创建menuSubItem在服务器端就
如何在 Angular Firebase 中修复浏览器刷新时的“TypeError：无法读取 null 的属性‘getIdToken’”？

我在 Angular 8 中使用 Firebase 在前端和后端对用户进行身份验证为了在后端对用户进行身份验证我需要发送用户 ID 令牌我正在使用 firebase getIdToken 来获取令牌它可以部分工作刷新页面时出现错误
将子域重定向到子文件夹

我需要编写重写规则将子域重定向到子文件夹例子子域名 domain io应该重定向到域名 io apps 子域名 and test7 domain io应该重定向到域名 io apps test7等等在 htaccess 文件中我可
删除Expo SYSTEM_ALERT_WINDOW权限android

我正在尝试更新我的 Google Play 商店应用程序但收到一条警告指出我的某些设备无法更新因为我拥有系统警报窗口权限我正在世博会管理的工作流程中工作请帮助我摆脱此权限我尝试了很多但是没有成功我如何从我的博览会反应本机项目
表情符号是如何实现的？

表情符号是如何存储的以及使用 unicode 的哪一部分来传输此类数据跨应用程序使用它是否有一个标准表情符号只是 unicode 中的字符他们有自己的代码和一切它们在屏幕上的准确显示方式这取决于操作系统及其安装的字体以下是 un
访问串行端口需要哪些 ASP.NET 权限？

我正在开发一个 asp net 应用程序我希望它通过串行端口与 arduino 板进行通信我创建了一个可以执行此操作的 Windows 应用程序并且它有效但是当我在 asp net 应用程序上使用相同的代码时我收到一个异常显示
增加 php 的最大执行时间

我已经添加了set time limit 0 函数可以增加执行时间但最多只执行2 3分钟 error reporting E ALL error reporting 1 set time limit 0 我想从一个需要很长时间的网站搜索链
算法来找到一个数字，其中4和7的乘积在给定范围内最大

我陷入了一个问题其中下界L和上限U给出现在假设整数的十进制表示形式X出现数字 4A次数和数字 7 出现B times 问题是要找到X其中最大值为A B for L lt X lt U 有什么高效的算法可以解决吗如果我正确理解了这个问题
gridview C# 中滚动查看器的水平偏移

我正在使用 Windows 8 发布预览版和 C VS 2012 开发 Metro 应用程序有没有办法通过提供 Horizo ntalOffset 来滚动网格视图水平滚动条 Brief 在scroll viewer类中我们可以使用动态移
ContentResolver.openAssetFileDescriptor() 在 Android 12 中需要很长时间

在 Android 12 中此方法调用需要几秒钟才能返回 val descriptor contentResolver openAssetFileDescriptor rootUri r 我向它传递一个树 Uri 它代表 USB 驱动器的
如何使用 bluebird 承诺 MongoDB 原生 Javascript 驱动程序？

我想使用MongoDB 原生 JS 驱动 with 蓝鸟承诺我该如何使用Promise promisifyAll 在这个图书馆 2 0 分支文档包含更好的承诺指南https github com petkaantonov bluebird
使用 Python 选择一列中具有特定范围值的行

我知道这很简单但我是 Python 的新用户所以我在这里遇到了一些麻烦顺便说一句我正在使用 Python 3 我有多个文件看起来像这样姓名日期年龄性别颜色 Name Date Age Sex Color Ray May

使用 Python 选择一列中具有特定范围值的行

对于多个输入文件：

使用 Python 选择一列中具有特定范围值的行 的相关文章

随机推荐

热门标签

使用 Python 选择一列中具有特定范围值的行的相关文章