使用 Python 解析文本文件

2024-04-06

我对 Python 很陌生，希望用它来解析文本文件。该文件包含 250-300 行，格式如下：

---- Mark Grey ([email protected] /cdn-cgi/l/email-protection) changed status from Busy to Available @ 14/07/2010 16:32:36 ----
----  Silvia Pablo ([email protected] /cdn-cgi/l/email-protection) became Available @ 14/07/2010 16:32:39 ----

我需要将此文件中的所有条目的以下信息存储到另一个文件（excel 或文本）中

UserName/ID  Previous Status New Status Date Time

因此，对于上述条目，我的结果文件应如下所示

Mark Grey/[email protected] /cdn-cgi/l/email-protection  Busy Available 14/07/2010 16:32:36
Silvia Pablo/[email protected] /cdn-cgi/l/email-protection  NaN  Available 14/07/2010 16:32:39

提前致谢，

任何帮助将非常感激

让您开始：

result = []
regex = re.compile(
    r"""^-*\s+
    (?P<name>.*?)\s+
    \((?P<email>.*?)\)\s+
    (?:changed\s+status\s+from\s+(?P<previous>.*?)\s+to|became)\s+
    (?P<new>.*?)\s+@\s+
    (?P<date>\S+)\s+
    (?P<time>\S+)\s+
    -*$""", re.VERBOSE)
with open("inputfile") as f:
    for line in f:
        match = regex.match(line)
        if match:
            result.append([
                match.group("name"),
                match.group("email"),
                match.group("previous")
                # etc.
            ])
        else:
            # Match attempt failed

会给你一个比赛部分的数组。然后我建议你使用csv module http://docs.python.org/library/csv.html以标准格式存储结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Parsing

使用 Python 解析文本文件的相关文章

我正在用 python 编写一个电报机器人

我想通过Python编写一个电报机器人但它不起作用 import telebot bot telebot TeleBot my token bot message handler content types text def sendin
存储为 np.arrays 的不同数据集的分组堆积条形图

我正在研究一个平衡问题我想比较一些数据我想通过创建不同年份的堆叠条形图来做到这一点每年我想要两个不同数据集的堆叠条形图我正在尝试创建一种分组堆积条形图我设法创建了我想要比较的 2 个堆叠条形图但它们仍然位于两个不同的图中我
from __future__ importabsolute_import 实际上做了什么？

I have answered https stackoverflow com a 22679558 2588818一个关于Python中绝对导入的问题我认为我通过阅读理解了这个问题Python 2 5 变更日志 https docs p
Python中的键盘可中断阻塞队列

It seems import Queue Queue Queue get timeout 10 键盘可中断 ctrl c 而 import Queue Queue Queue get 不是我总是可以创建一个循环 import Queue
是否可以在 SQLAlchemy 中创建一个可以创建父记录的事件侦听器？

有两个表父表和子表我想创建一个事件监听器触发器如果孩子没有父母它可以创建父母这就是我试图做的 class parent db Model tablename parent id db Column db Integer prim
将 KB/MB/GB 等字符串解析为数值

为了不发明自行车我想知道是否有任何库能够将大小字符串 MB KB TB MiB KiB 等的各种表示形式解析为基于数字字节的值 ActiveState Receipes 有一个示例here http code activestate c
python 正则表达式中括号的奇怪行为

我正在编写一个 python 正则表达式它可以在文本文档中查找引用的字符串从黑匣子中记录的航空公司飞行员的引用我首先尝试编写具有以下规则的正则表达式返回引号之间的内容如果以 single 打开则仅在以 single 关闭时返回
在 AWS Elastic Beanstalk 中部署 Flask 应用程序

当我部署 Flask 应用程序时它显示成功但是当我检索日志时我看到错误找不到 Flask 我的需求文件中有烧瓶任何帮助 Sat Jan 11 06 51 50 503908 2020 error pid 3393 remote 1
如何将当前日期分配给 odoo v8 中的日期字段？

我想将当前日期分配给以下代码中的日期字段 start date calendar obj create cr uid name rec res act ion user id rec res asgnd to id start date l
Matplotlib 动画未显示

当我在家里的电脑上尝试这个时它可以工作但在工作的电脑上却不行这是代码 import numpy as np import matplotlib pyplot as plt import matplotlib animation as
如何使用增量值向 Pyspark 中的 DataFrame 添加列？

我有一个名为 df 的 DataFrame 如下所示 Atr1 Atr2 Atr3 A A A B A A C A A 我想向其中添加一个具有增量值的新列并获取以下更新的 DataFrame Atr1 Atr2 Atr3
有没有更快的方法将数字转换为名称？

以下代码定义了映射到数字的名称序列它的设计目的是获取一个号码并检索一个特定的名称该类通过确保名称存在于其缓存中来进行操作然后通过索引到其缓存中来返回名称问题在这如何在不存储缓存的情况下根据数字计算出名称该名称可以被认为是一个以
让垂直网格线出现在 matplotlib 的线图中

我想在绘图上同时获得水平和垂直网格线但默认情况下仅显示水平网格线我正在使用一个pandas DataFrame从 python 中的 sql 查询生成 x 轴上带有日期的线图我不知道为什么它们没有出现在日期上我试图寻找这个问题的答案
Python - Map/Reduce - 如何在使用 DISCO 计数单词示例中读取 JSON 特定字段

我正在按照 DISCO 示例来计算文件中的单词数将单词数作为 Map Reduce 作业 http discoproject org doc disco start tutorial html 我对此工作没有任何问题但是我想尝试从包含
numpy.polyfit 没有关键字“cov”

我试图使用 polyfit 来找到一组数据的最佳拟合直线但我还需要知道参数的不确定性所以我也想要协方差矩阵在线文档建议我写 polyfit x y 2 cov True 但这给出了错误类型错误 polyfit 得到了意外的关键字参数
python中不规则点之间的坐标列表

想象一下我们为 x 和 y 随机选择两个介于 0 到 100 之间的点例如 95 7 35 6 现在使用简单的 pygame draw line 函数我们可以轻松地在这些点之间绘制一条没有任何间隙的线我的问题是我们如何找到两点之间
分别计算男女宿舍

我想要的结果是这样的 males 1990 Q1 value Q2 value Q3 Value Q4 Value females Q1 value Q2 value Q3 Value Q4 value 如果任何值不存在则默认值 0 imp
将数值和分类数据混合到具有密集层的 keras 序列模型中

我在 Pandas 数据框中有一个训练集我将此数据框传递到model fit with df values 以下是有关 df 的一些信息 df values shape 981 5 df values 0 array 163 0 6 83
Scrapy文件下载如何使用自定义文件名

For my scrapy http doc scrapy org index html我目前正在使用的项目文件管道 https doc scrapy org en latest topics media pipeline html scr
尝试输入字符串时出现名称错误[重复]

这个问题在这里已经有答案了 import pickle import os import time class Person def init self number address self number number self addr

随机推荐

Google Slide API - 如何多次复制一张幻灯片并每次创建一个唯一的对象 ID

一般来说我希望人们将一些数据放入谷歌工作表中并提供一个按钮该按钮获取数据并自动填充预制的谷歌幻灯片我选择了复制主幻灯片然后用数据替换单个文本模块的方法有更好的方法来实现我的目标吗这是主幻灯片这是我用于复制的代码但它只能复制母
当键列具有不同名称时实体拆分？

我正在使用 Entity Framework 4 3 1 Code First 并且需要在两个表之间拆分实体这些表有一个共享的主键并且是一对一的但每个表上的列的名称并不相同我无法控制数据布局也不能请求任何更改例如 SQL 表可以
带锚点的 ASP.Net MVC RedirectToAction

我有以下问题例如我有这样的路线 routes Add new Route forums thread threadOid last new MvcRouteHandler Defaults new RouteValueDictionary
EnableRaisingEvents（启用和禁用它）

我正在维护一些代码其中有两个 FileSystemWatcher 事件这使得调试变得困难并且有错误所以我的想法是通过使执行顺序化来简化代码差不多是这样的 Main method 1 normal code here 2 enabl
如何配置 Beyond Compare 以忽略注释中的 SCM 替换文本？

我确实有一些被 SCM 替换的文本序列在我的例子中是 Perforce 我确实想配置 BeyondCompare 将这些序列视为不重要的差异以便在比较文件时能够忽略它们就我而言它是关于 Python 源文件的序列看起来像 Id d
如何在 Struts 2 中创建自定义 URL？喜欢 www.twitter.com/goodyzain

我正在开发一个项目我想为每个用户提供唯一的 URL 例如 www SocialNetwork com jhon www SocialNetwork com jasmine 到目前为止我能够实现这一点 www SocialNetwork c
Flow Shop 到布尔可满足性 [多项式时间缩减]

我联系您是为了了解如何将流水车间调度问题转化为布尔可满足性我已经对 N N 数独 N 皇后和班级调度问题进行了此类简化但我对如何将流水车间转换为 SAT 有一些问题 SAT 问题如下所示目标是使用不同的布尔变量找到每个变量的影
Kotlin - 为什么编译器合约只允许引用函数参数

在编写验证函数时这些验证函数通常会检查可空性尽管在调用这些函数之后可以安全地使用对象成员就像它们不可为 null 一样但 Kotlin 编译器契约不允许指定此行为例如 data class EmployeeDto val nam
为 Windows 创建 Ruby 应用程序

我想开发一个Windows应用程序老实说我现在不太关心跨平台但仍然很好我想使用 Ruby 因为它的语法相当简单而且简单易学我的应用程序就像一个游戏关卡创建者您可以在其中设计自己的关卡然后通过读取创建者应用程序创建的项目文
意外响应代码 404 齐射

我收到以下代码发送的某些请求的错误但我不知道为什么 private void DeActivateReq String toolID String token String Childid String url http 54 77 12
如何将 AutoValue 与 Retrofit 2 结合使用？

我已经在一个项目中使用了 AutoValue 和 android apt 插件并且我知道 Ryan Harter 的 AutoValue gson 扩展但是如何连接 Retrofit 2 以在抽象类上使用扩展和工厂方法 String g
具有多个预览的 AVCaptureSession

我有一个 AVCaptureSession 与 AVCaptureVideoPreviewLayer 一起运行我可以看到视频所以我知道它正在发挥作用但是我想要一个集合视图并在每个单元格中添加一个预览层以便每个单元格显示视频的预览
Celery 使连接由对等方重置

我设置了rabbitmqserver并使用以下步骤添加了用户 uruddarraju usr lib rabbitmq lib rabbitmq server 3 2 3 sudo rabbitmqctl list users Listin
Chromedriver `driver.manage.logs.get(:browser)` 在 chromedriver 75.0.3770.8 上失败

访问时driver manage logs get browser 在 chromedriver 75 0 3770 8 上我收到此错误 undefined method log for
pygame中的旋转

我一直在寻找如何使我的图像围绕单个点旋转的解决方案但据我发现没有任何方法真正起作用我知道的我可以使用旋转pygame transform rotate surface angle 我需要不断重置中心以便图像不会自行旋转需要更新图
如何设置进度条以在android中加载数据的活动

这是我的第一堂课进行 URL 加载 public class HelloWebViewClient extends WebViewClient Override public boolean shouldOverrideUrlLoadin
如何仅使用javascript而不使用jquery进行无限滚动

我希望用javascript而不用jquery实现无限滚动我是 JavaScript 新手经过网上搜索我得到了这段代码 div div class page div div
在 Javascript 中解析 JSON 响应以获取键/值对 [重复]

这个问题在这里已经有答案了如何仅在 Javascript 中获取每个对象的名称和值访问对象的属性有两种方法 var obj a foo b bar obj a foo obj b bar 或者如果您需要动态执行此操作 var key
Haskell GHC 动态编译仅适用于第一次编译

按照发布的 GHC 教程here http www bluishcoder co nz 2008 11 dynamic compilation and loading of html并按照以下建议对此代码进行更改我之前问过的一个堆栈溢出问题
使用 Python 解析文本文件

我对 Python 很陌生希望用它来解析文本文件该文件包含 250 300 行格式如下 Mark Grey email protected cdn cgi l email protection changed status from

使用 Python 解析文本文件

使用 Python 解析文本文件 的相关文章

随机推荐

热门标签

使用 Python 解析文本文件的相关文章