在 Python 正则表达式中使用 ^ 匹配行首

2024-02-14

我正在尝试从 Thomson-Reuters Web of Science 中提取出版年份 ISI 风格的数据。 “出版年份”的行看起来像这样（在行的最开头）：

PY 2015

对于我正在编写的脚本，我定义了以下正则表达式函数：

import re
f = open('savedrecs.txt')
wosrecords = f.read()

def findyears():
    result = re.findall(r'PY (\d\d\d\d)', wosrecords)
    print result

findyears()

然而，这会产生假阳性结果，因为该模式可能出现在数据的其他位置。

所以，我只想匹配行开头的模式。通常我会使用^为了这个目的，但是r'^PY (\d\d\d\d)'无法匹配我的结果。另一方面，使用\n似乎做我想做的事，但这可能会给我带来进一步的复杂化。

re.findall(r'^PY (\d\d\d\d)', wosrecords, flags=re.MULTILINE)

应该管用

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

在 Python 正则表达式中使用 ^ 匹配行首的相关文章

向 polls urls.py 添加额外的过滤器会导致测试失败

按照 djangoproject 的教程我尝试让 urls py 过滤掉没有选择下面 urlpattern 的民意调查 urlpatterns patterns url r ListView as view queryset Poll o
合并数据框中的值以写入 Excel

我有一个看起来像的数据框 column1 column2 column3 colum4 column5 1 r n 1 r s 1 r n 2 r s 3 r n 3 2 r n 1 r s 1 r n 4 r s 4 r n 5 3 r
如何在 kubernetes 上使多个 pod 相互通信

我是 Kubernetes 新手我正在尝试通过 microk8s 将应用程序部署到 Kubernetes 该应用程序包含Python Flask后端 Angular前端 Redis和MySQL数据库我将映像部署在多个 Pod 中状态显
在Python中迭代文件对象不起作用，但readlines()可以，但效率低下

在下面的代码中如果我使用 for line in fin 它只对 a 执行但如果我使用 wordlist fin readlines for line in wordlist 然后它执行 a thru z But readlines 立
正则表达式：如何找到模式的最大整数值？

想象一下我有以下字符串 I ll have some 1 some 42 and maybe some 5 as well 基本上我有兴趣了解遵循模式 integer 的最大整数值我什至不确定是否可以使用正则表达式我可以使用什么正则表
使用Python进行图像识别[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个想法就是我想识别图像中的字母可能是 bmp或 jpg 例如这是一个包含字母 S 的 bmp 图像我想做的是使用Pyth
什么时候用==，什么时候用is？

奇怪的是 gt gt gt a 123 gt gt gt b 123 gt gt gt a is b True gt gt gt a 123 gt gt gt b 123 gt gt gt a is b False Seems a is b
直接打开Spyder还是通过Pythonxy打开？

之前我一直在运行PythonSpyder 我总是开始Spyder直接双击其图标今天突然发现我还有一个东西叫Python x y 我注意到我也可以开始Spyder通过它这两种方法有什么区别吗如果不是的话有什么意义Python x y
获取 HTML 代码的结构

我正在使用 BeautifulSoup4 我很好奇是否有一个函数可以返回 HTML 代码的结构有序标签这是一个例子 h1 Simple example h1 p This is a simple example of html page
Bottle 是否可以处理没有并发的请求？

起初我认为 Bottle 会并发处理请求所以我编写了如下测试代码 import json from bottle import Bottle run request response get post import time app B
如何将字符串方法应用于数据帧的多列

我有一个包含多个字符串列的数据框我想使用对数据帧的多列上的系列有效的字符串方法我希望这样的事情 df pd DataFrame A 123f 456f B 789f 901f df Out 15 A B 0 123f 789f 1 45
如何在 Python 中将 EXR 文件的 float16 转换为 uint8

我正在使用 OpenEXR 读取 Python 中的 EXR 文件我有带有半数据 float16 的 R G 和 B 通道我尝试使用 Numpy 将数据从 float16 转换为 uint8 0 255 颜色但没有成功 rCh get
Python Flask应用程序无法被网络中的远程计算机访问

我在本地主机上的 python 上运行了一个简单的 Flask Web 应用程序 Web 应用程序在 127 0 0 1 8000 上运行但我无法使用 myHostComputerIPaddress 8000 从网络中的远程计算机访问它
如何从外语线程调用Python函数（C++）

我正在开发一个程序使用 DirectShow 来抓取音频数据媒体文件 DirectShow 使用线程将音频数据传递给回调我的程序中的函数然后我让该回调函数调用另一个函数 Python 中的函数我使用 Boost Python 来包
单击 selenium 中的链接时循环遍历表格的行（python）

示例页面源代码如下所示 div class div1 table class foot market tbody td class today name td tbody tbody td class today name td tbody
为什么 tesseract 无法从这个简单的图像中读取文本？

我在 pytesseract 上阅读了大量的帖子但我无法让它从一个简单的图像中读取文本它返回一个空字符串这是图像我尝试过缩放它灰度化它调整对比度阈值模糊以及其他帖子中所说的一切但我的问题是我不知道 OCR 想要更好地工作
Python中的MariaDB连接器无法连接到远程服务器

我使用与远程 Mariadb 服务器的连接已有几个月了今天无法再通过 macOS 上的 python mariadb 模块和 mariadb 连接器建立连接基本安装如下 brew install mariadb connector c
用户的完整 UNIX 用户名

想知道您是否知道是否有一种巧妙的方法可以从 shell 获取完整的用户名示例如果我的 UNIX 用户名是 froyo 那么我想获取我的全名在本例中如系统中注册的那样 froyo Abhishek Pratap Finger 命令可以
Python模糊字符串匹配作为相关样式表/矩阵

我有一个文件其中包含 x 个字符串名称及其关联的 ID 本质上是两列数据我想要的是一个格式为 x by x 的相关样式表将相关数据作为 x 轴和 y 轴但我想要 fuzzywuzzy 库的函数 fuzz ratio x y 作为输出
将自定义属性添加到 Tk 小部件

我的主要目标是向小部件添加隐藏标签或字符串之类的内容以在其上保存简短信息我想到创建一个新的自定义 Button 类在本例中我需要按钮它继承所有旧选项这是代码 form tkinter import class NButton Bu

随机推荐

使用 jQuery 在文本区域内匹配和突出显示标签/单词（更改颜色和字体粗细）

I ve textarea当我添加时我就开始输入tags我在数组中定义所以根据我的情况应该说in array但这是说not in array这是我的示例代码 document ready function var tagsArray ne
R - 绘图 - 隐藏颜色条

如何在从他们的网站上获取的以下情节示例中隐藏颜色条 df lt read csv https raw githubusercontent com plotly datasets master 2014 world gdp with code
当汇总为双精度时，从 ForEach 循环转换为 Parallel.ForEach 循环会减慢速度

我有一段 C 代码如下此代码总结了 DataTable 中的一列双精度 var data this Db ExecuteRead query this Score Name var time 0 0 foreach DataRow ro
Android Appwidget textview不更新

你好我的 Android 小部件遇到了一个非常奇怪的问题我广泛查看了很多地方但我似乎无法弄清楚出了什么问题基本上我在我的小部件中调用待定意图广播并在 onrecivie 方法中成功捕获该意图但是在 onRecive 方法中当
python子进程隐藏stdout并等待它完成

我有这个代码 def method a self command line somtoolbox GrowingSOM som prop path subprocess Popen shlex split command line def
Visual Studio 2017 调试错误：为了防止在评估函数 *.toString 时发生不安全中止，允许所有线程运行

我将 Visual Studio 2017 更新到版本 15 8 2 这次更新之后我在调试时开始遇到这些错误以下是错误消息 Visual Studio 调试错误为了防止在评估函数 toString 时发生不安全中止允许所有线程运行
链接到 Github 上的另一个 html 页面

我试图寻找解决方案但不太确定如何在谷歌中以简洁的方式表达我的问题以获得解决方案我对 Html 和 github 相当陌生最近我用自己的 html 代码制作了自己的 Github 页面简而言之我在github中有一个文件 index
如何在 iOS 中禁用特定方向

我想在某些视图中禁用横向方向我已经重写了以下两个方法但这些方法不会随时调用 NSUInteger supportedInterfaceOrientations return UIInterfaceOrientationMaskPortr
Spring Boot 在 Apache 代理后面嵌入 Tomcat

我们有一个 Spring Boot Spring MVC 应用程序在 Apache SSL 代理后面的专用应用程序服务器上嵌入了 Tomcat 代理服务器上的 SSL 端口是 4433 转发到应用程序服务器上的端口 8080 所以代理服务
在 Python 中将文件从一个位置复制到另一个位置

我有一个名为fileList包含数千个文件名和大小如下所示 home rob Pictures some folder picture one something jpg 143452 home rob Pictures some oth
如何将文件保存到我的桌面文件夹 Angular 6

我已经从base64构建了一个文件我想将其保存到本地系统 dataURLtoFile dataurl filename format const arr dataurl split const mime arr 0 match 1 con
根据模板参数创建字符串

I have many像这样的类方法 template
如何从 NSMutableArray 中删除 NULL 值？ IOS

我有一个生日数组因为数组是从 facebook 填充的所以有一些朋友的生日是私有的所以它包含 NULL 如何将该数组转换为空字符串只要存在 null 值数组如下所示
在 ASP.NET 中构建动态“高级搜索”控件的建议

替代文本 http img3 imageshack us img3 1488 advancedsearch png http img3 imageshack us img3 1488 advancedsearch png 我正在 ASP N
如何修复 Git 中的“packet_write_wait：连接到...损坏的管道”错误

当我git push文件发送到我的远程存储库它会抛出错误 packet write wait 连接到 13 250 177 223 端口 22 管道损坏之前git push 我已经从远程克隆了该项目并且git add git commi
正确设置 IIS7.5 机器帐户以进行匿名网站访问

使用 IIS 7 5 IIS IUSRS 应该是要使用的帐户我收到 401 未经授权由于凭据无效访问被拒绝错误如果我添加一个带有 Read 的 EVERYONE 帐户它就可以工作但最好不要拥有Everyone 帐户知道为什么
C++ 隐式进入/启动主要可执行错误

我在 Mac 上运行 Hadoop 管道代码时遇到问题这是我的 C 代码 include
一起使用 ASP.Net AJAX 和 JQuery 的任何缺点

我们计划使用 jQuery 库来增强我们的客户端 JavaScript 需求尝试同时使用 ASP Net AJAX 和 jQuery 时是否存在任何重大问题这两个库似乎都将用于特殊目的有什么冲突是我们需要注意的吗我们还使用使用 A
如何在 C# 中将泛型对象分配给非泛型引用

我是一名 Java 人员正在尝试用 C 实现一些代码我研究了一个小时但没有找到任何东西我有一个声明为通用的接口称为 interface TypeSerializer
在 Python 正则表达式中使用 ^ 匹配行首

我正在尝试从 Thomson Reuters Web of Science 中提取出版年份 ISI 风格的数据出版年份的行看起来像这样在行的最开头 PY 2015 对于我正在编写的脚本我定义了以下正则表达式函数 import re

在 Python 正则表达式中使用 ^ 匹配行首

在 Python 正则表达式中使用 ^ 匹配行首 的相关文章

随机推荐

热门标签

在 Python 正则表达式中使用 ^ 匹配行首的相关文章