提取文本文件每行第一个逗号之前的文本

2024-04-22

我有一个如下所示的文件：

Breve, a writ; used more frequently in the plural brevia. 
Brevia magistralia, official writs framed by the clerks in 
chancery to meet new injuries, to which the old forms of action 
were inapplicable. Sea Trespass on the case. Brevia testata, 
short attested memoranda, originally introduced to obviate the 
uncertainty arisina; from parol feoffments, hence modern con- 
veyances have gradually arisen.

我想提取每行中第一个逗号（，）之前出现的单词

预期输出：

Breve
Brevia magistralia
chancery to meet new injuries
were inapplicable. Sea Trespass on the case. Brevia testata
short attested memoranda
uncertainty arisina; from parol feoffments

my code:

with open('test.txt','r') as file:
    for line in file:
        print(line[0:line.find(',')])

output:

Breve

任何帮助表示赞赏

为什么需要正则表达式？str.split应该足够好了。

with open('test.txt','r') as file:
    for line in file:
        text = line.split(',', 1)[0] # add nsplits = 1 for efficiency 
        ... # do something with text

但是，如果您确实需要正则表达式，您可以使用类似以下内容的内容：

for line in file:
        m = re.match('[^,]+', line)
        if m:
            text = m.group(0)

Where [^,]+匹配从一开始就不是逗号的任何内容 (credits https://stackoverflow.com/questions/46190206/python-extract-word-before-1st-string-occurrence-in-each-line-in-text-file/46190293?noredirect=1#comment79342716_46190293).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

file

提取文本文件每行第一个逗号之前的文本的相关文章

x % 2 == 0 是什么意思？ [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 我确信这是
按行中的值选择 pandas 数据框中的列

我有一个pandas DataFrame列太多我想选择行中的值等于的所有列0 and 1 所有列的类型是int64我无法通过以下方式选择它们object或其他类型我怎样才能做到这一点 IIUC 然后你可以使用isin http pand
配置解析器和带 % 的字符串

愚蠢的问题当然简单的答案我正在使用 configparser 从文件中读取一些字符串当字符串具有符号例如时它会抱怨 ConfigParser InterpolationSyntaxError 后必须跟或找到有人熟悉这个
嵌套列表递归python的序列

给定一些数字 n 我想生成一个大小为 n 的列表其中以下示例显示列表中的第 n 个元素应该如何对于 n 0 返回对于 n 1 返回对于 n 2 返回对于 n 3 返回基本上它采用先前的列表并将它们附加到新列表中我尝试过以下方
使用 pandas 的 TimeGrouper() 按 1 秒的间隔查找列计数

考虑由时间戳索引的数据帧数据如下所示 Index Receiver Type Retry 1970 01 01 00 00 00 000000000 R1 Data 1 1970 01 01 00 00 00 800000000 R1
在 python 中读取具有恶意字节 0xc0 的文件，导致 utf-8 和 ascii 出错

尝试将制表符分隔的文件读入 pandas 数据帧 gt gt gt df pd read table fn na filter False error bad lines False 它会出错如下所示 b Skipping line 58
Python：如何将包含对象的列表保存在文件中？

我尝试创建不同的对象使用类和对象并将它们保存在文件中以便稍后编辑或检索它们然而这就是它的样子 GlobalCategories GlobalContent def LoadData x y import pickle with ope
从 Get-ChildItem -Path 返回对象数组

从 powershell 开始 ls R txt将按目录递归列出文件或者更好 PS gt Get ChildItem Path C Test Name logs anotherfile txt Command txt CreateTest
将问号 (?) 替换为 (\\?)

我正在尝试定义一个模式来匹配文本中带有问号的文本在正则表达式中问号被认为是一次或根本不那么我可以用替换文本中的符号来解决模式问题吗 String text aaa aspx pubid 222 zzz Pattern p Pa
在散景中隐藏轴

如何在散景图中隐藏 x 轴和 y 轴我已经根据此进行了检查和尝试 p1 figure visible None p1 select type Axis visible 0 xaxis Axis plot p1 visible 0 和喜欢h
Tensorflow无法分配设备进行操作

我正在尝试跑步NVidia 脸部生成器演示 https github com tkarras progressive growing of gans在我的电脑上我使用的是 Windows 10 我已经下载了源代码并尝试按照页面下方的步骤
如何以最大窗口形式保存 matplotlib 图而不是默认大小？

有人知道我应该如何解决这个问题吗我知道有一个保存按钮我可以手动执行此操作但我正在绘制 100 多个图表所以我希望有一种方法可以自动执行此操作我正在使用 TkAgg 后端并寻找任何可能的解决方案通过在我的绘图函数末尾使用以下内容
subprocess.Popen args 参数的最大长度是多少？

我在用Popen http docs python org library subprocess html using the subprocess modulesubprocess 模块中的函数来执行命令行工具 subprocess Po
Python：如何使用 struct.pack_into 将不同类型的数据打包到字符串缓冲区中

我正在尝试将一些无符号 int 数据打包到使用创建的字符串缓冲区中ctypes create string buffer 这是以下代码段以及显示错误的运行示例在键盘上 http codepad org S8nUWMcW import st
获取小部件的背景颜色 - 真的

我无法获取小部件的实际背景颜色在我的特殊情况下我在使用 QTabWidget 中的小部件时遇到问题这是在Windows7上因此经典的小部件有一些灰色背景而选项卡内的小部件通常用白色背景绘制 I tried def bgcolor
使用 nditer 进行浅层迭代

我有这样一个数组 gt gt gt y np random randint 0 255 2 2 3 gt gt gt array 242 14 211 198 7 0 235 60 81 164 64 236 我必须迭代每个triplet元
如何使用高复制数据存储

好的我已经看过了video http www google com events io 2011 sessions more 9s please under the covers of the high replication datas
在 Python 中使用列表理解来执行类似于 zip() 的操作？

我是一名 Python 新手我想做的事情之一就是围绕列表理解进行思考我可以看到这是一个非常强大的功能值得学习 cities Chicago Detroit Atlanta airports ORD DTW ATL print zip
仅当锚点尚未存在时，正则表达式才用锚点替换网址

我以前见过类似的问题但没有一个有效的解决方案我试图用锚标记替换页面上的所有网址但仅限那些不在锚标记内的网址 so http google com http google com应替换为 a href http google com h
如何修复 Python 中损坏的 utf-8 编码？

我的字符串是Ni m B T t Thi n s Nh t H nh 我想将其解码为Ni m B T t Thi n s Nh t H nh 我在那个网站上看到可以做到这一点http www enderminh com minh utf8

随机推荐

WordPress 树枝模板短代码不显示

我在 Wordpress 中使用 Symfony Twig 模板一切运行良好除了我无法在页面模板中显示任何短代码我正在尝试使用 Contact form 7 插件显示联系表单短代码是这样的 contact form 7 id 123
无法让 Karaf 4.2.6 使用 log4j2 和 JsonLayout 作为布局类型进行日志记录

我一整天都在做这件事但在尝试了这么多组合后却没有让它发挥作用归根结底我正在寻找从 Karaf 获取 JSON 日志记录的明确步骤列表我什至浏览了 Maven Karaf 插件源代码试图解决这个问题尽管也许我看的还不够远我正在使
将特定选定的列提取到新的 DataFrame 作为副本

我有一个包含 4 列的 pandas DataFrame 我想创建一个new数据框only有三列这个问题类似于从数据框中提取特定列 https stackoverflow com questions 10085806 extractin
使用导航组件设置 BottomNavView 后，Jetpack Compose TopAppBar 闪烁

使用 Jetpack Compose 应用程序进行工作BottomNavigationView和导航组件我对活动内的底部栏进行了常规设置 val navHostFragment supportFragmentManager findFra
SQL Server 更新分组依据

我尝试在 MS SQL 上执行此操作但仅在 Group by line 处返回错误 update temp Set Dos Count 1 From Temp Table2010 s where Id s Total and s tota
在 php 中上传文件大小 > 5MB 时出错？

我上传的文件大小 gt 5MB 和配置php ini 但是当上传文件是结果时error File Error size ini 如何配置还有另一个配置条目会影响此行为 post max size
Windows 服务恢复未重新启动服务

我将 Windows 服务的恢复配置为在失败后延迟一分钟重新启动但我从未真正重新启动服务即使有最明显的错误我确实在事件查看器中收到一条消息无法在源 MyApp exe 中找到事件 ID 1 的描述本地计算机可能没有必要的注册表信息
pip install ortools：没有匹配的发行版 - Alpine

在 Docker 中我尝试运行 pip install ortools 但找不到其他 pip 安装包可以完美运行我在 Dockerfile 中使用 FROM python 3 6 8 alpine bash 4 4 pip insta
实体框架：获取存储库中的子类对象

我有与下面列出的数据库表对应的以下模型经理就是雇员会计师也是雇员让所有管理器都进入存储库的最佳方法是什么如何实现GetAllManagers 方法这是正确的TPT吗 CODE MyRepository MyEmployeeRepo
schema.org 产品可用性标签标记

哪一个是正确的 span span 我检查了官方模式文档并在示例中找到了所有这些我想它们都可以但目前有什么首选标准吗 Using span与content属性是invalid HTML5 和 Microdata 都不允许content
Amazon S3 静态网站不提供 css 或 js 文件

我一直在尝试在 Amazon S3 上建立一个静态网站我已经设置好使用我的个人域到目前为止我已经能够很好地访问内容所有链接都有效无论是根目录中的页面还是子文件夹中的页面因此 S3 似乎可以遵循我正在使用的路径问题是没有任何
根据另一个数据库的查询结果查询一个数据库

我在 VS 2013 中使用 SSIS 我需要从 1 个数据库获取 ID 列表并使用该 ID 列表我想查询另一个数据库即SELECT from MySecondDB WHERE ID IN list of IDs from MyFir
扩展 Three.js 类

我想扩展 Three js Object3D 类但不知道该怎么做有一个 Stackoverflow 问题我已经阅读重新阅读和尝试过但无法让它为我工作有没有办法扩展 ThreeJS 对象 https stackoverflow c
Xcode 服务：选择 Git 分支

我开始在 Mavericks 中设置新的 Xcode 服务我创建了一个新的机器人但没有询问我它应该构建的分支如何为每个机器人选择分支我不仅想建造master 但也有不同的分支在当前版本中当您在 Xcode 中创建机器人时它将链
如何将音乐播放器保留在页脚中，当我单击子页面的链接时，该音乐播放器不会重新加载？

我已经尝试解决这个问题有一段时间了并且浏览了许多论坛来寻找解决方案这是我的设置任何帮助将不胜感激我目前有一个索引页在内容部分的上方和下方加载 JavaScript 页眉和页脚我在标题内还有一个导航链接列表我的音乐播放器位于
将向量::emplace_back与shared_ptr一起使用

include
无法让 mongoid 与 Rails 4 一起使用

我是按照官方教程来的 http mongoid org en mongoid docs installation html 我在 Gemfile 中注释掉了 sqlite3 以及以下几行 gem mongoid gt 4 github mo
RandomNumberGenerator 与 RNGCryptoServiceProvider

根据 MSDN 文档随机数生成器 http msdn microsoft com en us library system security cryptography randomnumbergenerator 28v VS 71 29 a
Android Fabric Twitter 分享监听器

我使用 Fabric SDK 从我的应用程序发送推文我构建了一个共享对话框并从活动中发送推文 Override protected void onCreate Bundle savedInstanceState super onCreat
提取文本文件每行第一个逗号之前的文本

我有一个如下所示的文件 Breve a writ used more frequently in the plural brevia Brevia magistralia official writs framed by the clerk

提取文本文件每行第一个逗号之前的文本

提取文本文件每行第一个逗号之前的文本 的相关文章

随机推荐

热门标签

提取文本文件每行第一个逗号之前的文本的相关文章