Python正则表达式不匹配http://

2024-01-21

我面临匹配和替换某些单词的问题，这些单词未包含在 http:// 中

当前正则表达式：

 http://.*?\s+

这符合模式http://www.egg1.com http://www.egg2.com http://www.egg2.com

我需要一个正则表达式来匹配 http:// 之外包含的某些单词

Example:

"This is a sample. http://www.egg1.com and http://egg2.com. This regex will only match 
 this egg1 and egg2 and not the others contained inside http:// "

 Match: egg1 egg2

 Replaced: replaced1 replaced2

最终输出：

 "This is a sample. http://www.egg1.com and http://egg2.com. This regex will only 
  match this replaced1 and replaced2 and not the others contained inside http:// "

问题：需要匹配某些模式（例如：egg1 Egg2），除非它们是 http:// 的一部分。如果 Egg1 和 Egg2 出现在 http:// 中，则不要匹配它们

我能想到的一种解决方案是为 HTTP-URL 和您的模式形成一个组合模式，然后相应地过滤匹配项：

import re

t = "http://www.egg1.com http://egg2.com egg3 egg4"

p = re.compile('(http://\S+)|(egg\d)')
for url, egg in p.findall(t):
  if egg:
    print egg

prints:



egg3
egg4

UPDATE:使用这个习语re.sub()，只需提供一个过滤函数：

p = re.compile(r'(http://\S+)|(egg(\d+))')

def repl(match):
    if match.group(2):
        return 'spam{0}'.format(match.group(3))
    return match.group(0)

print p.sub(repl, t)

prints:



http://www.egg1.com http://egg2.com spam3 spam4

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

regexnegation

Python正则表达式不匹配http:// 的相关文章

使用python查找txt文件中字母出现的次数

我需要从 txt 文件中读取该字母并打印 txt 文件中出现的次数到目前为止我已经能够在一行中打印内容但计数有问题有人可以指导吗 infile open grades txt content infile read for char
将非常大的Python列表输出保存到mysql表中

我想将 python 生成的列表的输出保存在 mysql 数据库的表中该表如下所示 mysql 中的 myapc8 表 https i stack imgur com 4B4Hz png这是Python代码在此输入图像描述 https
将 numpy 数组合并为单个 int

numpy 数组怎么可以这样 10 22 37 45 转换为单个 int32 数字如下所示 10223745 这可以工作 gt gt gt int join map str 10 22 37 45 10223745 基本上你使用map s
在Python中从大文件中搜索单词列表

我是新蟒蛇我有一个单词列表和一个非常大的文件我想删除文件中包含单词列表中的单词的行单词列表按排序给出并且可以在初始化期间输入我正在努力寻找解决这个问题的最佳方法我现在正在进行线性搜索这花费了太多时间有什么建议么您可以使用i
Zend RegEx Validator 的自定义有意义的错误消息

我正在验证表单中的文本字段如下所示 name new Zend Form Element Text name name gt setLabel First Name gt setRequired true gt addFilter new
使用 Boto3 以字符串形式打开 S3 对象

我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
无法在 selenium 和 requests 之间传递 cookie，以便使用后者进行抓取

我用 python 结合 selenium 编写了一个脚本来登录网站然后从driver to requests这样我就可以继续使用requests进行进一步的活动 I used item soup select one div class
如何确保 re.findall() 停止在正确的位置？

这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
Arcpy 模数在 Pycharm 中不显示

如何将 Arcpy 集成到 Pycharm 中我尝试通过导入模块但它没有显示我确实知道该模块仅适用于 2 x python arcpy 在 PyPi Python 包索引上不可用因此无法通过 pip 安装要使用 arcpy 您需要
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
Python HMAC：类型错误：字符映射必须返回整数、None 或 unicode

我在使用 HMAC 时遇到了一个小问题运行这段代码时 signature hmac new key secret key msg string to sign digestmod sha1 我收到一个奇怪的错误 File usr loca
Spark 和 Python 使用自定义文件格式/生成器作为 RDD 的输入

我想问一下 Spark 中输入的可能性我可以看到从http spark apache org docs latest programming guide html http spark apache org docs latest pro
Plotly：如何检查基本图形结构（版本 4）

对于旧版本的plotly 例如在 Jupyterlab 中您可以简单地运行figure像这样检查你的图形的基础知识 Ouput data marker color red size 10 symbol 104 mode markers l
python中basestring和types.StringType之间的区别？

有什么区别 isinstance foo types StringType and isinstance foo basestring 对于Python2 basestring是两者的基类str and unicode while type
查找 Pandas DF 行中的最短日期并创建新列

我有一个包含多个日期的表有些日期将为 NaN 我需要找到最旧的日期所以一行可能有 DATE MODIFIED WITHDRAWN DATE SOLD DATE STATUS DATE 等因此对于每一行一个或多个字段中都会有一个日期
从 Flask 运行 NPM 构建

我有一个 React 前端我想在与我的 python 后端 API 相同的源上提供服务我正在尝试使用 Flask 来实现此目的但我遇到了 Flask 找不到我的静态文件的问题我的前端构建是用生成的npm run build in s
minizinc python 安装

我通过 anaconda 提示符在 python 上安装了 minizinc 就像其他软件包一样 pip install minizinc 该软件包表示已成功安装我可以导入该模块但是我正在遵循基本示例https minizinc py
rpy2 无法加载外部库

希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包该包以 rJava 作为依赖项 venneuler 和 rJa
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
如何使用 python 定位和读取 Data Matrix 代码

我正在尝试读取微管底部的数据矩阵条形码我试过libdmtx http libdmtx sourceforge net 它有 python 绑定当矩阵的点是方形时工作得相当好但当矩阵的点是圆形时工作得更糟如下所示另一个复杂问题是在某

随机推荐

返回 PHP 多维数组中最后一个数组的元素

如何在 PHP 中动态显示最后一个数组中的元素例如 Array 0 gt Array id gt 6 user id gt 8 category path gt Sport 1 gt Array id gt 8 user id gt 8
syscall_thread_switch iOS 8.3 竞赛 - CocoaLumberjack bug？如何调试这个？

我在我的应用程序中遇到了竞争条件每当我暂停调试时所有或除 1 个线程之外的所有线程都会卡在 syscall thread switch 上它在模拟器上重现得更频繁在 iPad Air 上也是如此 CocoaLumberjack 的
从 Hibernate 4.3.6 迁移到 Hibernate 5

我有一个旧项目我使用 Java API 中的 Date 我想将其更改为新的 Java 8 Date APILocalDateTime 我读到 Hibernate 5 之前的版本不支持新的 Java 8 Date API 我决定从 Hibe
原生 Vim 随机数脚本

我知道有多种方法可以获取随机数例如从 shell 中然而我在 Android 手机上运行 vim 几乎没有编译而且它不必是严格随机的关键是在 Vim 中获取一系列相当好的随机数的有趣简洁快速即使用 vim 原生函数或简
MS Access 2010 运行时 - 连续形式中缺少鼠标右键单击上下文菜单

我在 MS Access 2003 中编写了一个应用程序我可以使用 Access 2010 运行该应用程序但是当我仅使用 MS Access 2010 运行时打开同一个 2003 应用程序时我无法再以连续形式使用鼠标右键单击因为我可
向下转型最佳实践 (C++)

静态代码分析工具往往会大量谈论将基类向下转换为派生类我还发现了一些编码标准指南其中提到不要这样做所以我想知道什么是最佳实践方法这是我的用例我有一个 Base 接口 DerivedA DerivedB 类然后是一个包含 Base
如何在codeigniter中使用pdo？

据我所知 PDO 支持最近已添加到 codeigniter 但我找不到任何有关如何实际使用它的文档或教程谁能告诉我如何使用它您可以编辑 application config database php并启用 PDO 驱动程序 db def
Java中Float的最大值？

下列question https stackoverflow com questions 3884793 minimum values and double min value in java表示 Double 的最小值是 Double M
QEMU和KVM在虚拟机I/O中扮演什么角色？

我发现 QEMU 和 KVM 之间的界限非常模糊我发现有人说虚拟机是qemu进程而另一些人说是kvm进程究竟是什么而QEMU和KVM在虚拟机I O中扮演什么角色呢比如一个vm做PIO MMIO的时候是qemu还是kvm会把它困住
matplotlib：同一张图上有2个不同的图例

我有一个图其中不同的颜色用于不同的参数不同的线条样式用于不同的算法目的是比较使用相似参数执行的不同算法的结果这意味着我总共使用了 4 种不同的颜色和 3 种不同的线条样式在同一张图表上总共使用了 12 个图我实际上是根据颜色构建
带有 CSS 波浪的动画文本

怎么运行的 The png下面显示的图像被剪辑到带有动画的文本中行动中 body background 000000 Wave Loader text transform uppercase font family Cabin Conde
如何通过 SSH 协议克隆 Github Gist？

Github 似乎确实希望我们使用 HTTPS 协议来使用 Gists 例如他们只在 Gist 页面上列出 HTTPS url 例如https gist github com donatello 5834862 https gist gi
从 Microsoft SQL 查询到 Pandas Dataframe

我正在尝试用 Python3 编写一个程序它将在 Microsoft SQL 中的表上运行查询并将结果放入 Pandas DataFrame 中我的第一次尝试是下面的代码但由于某种原因我不明白这些列没有按照我在查询中运行它们的顺序出
iOS 上的 HTML5 MSE

我正在尝试使用 Chrome Mobile 让 hls js 在 iOS 上工作但我注意到 Chrome Mobile 不支持 MediaSourceExtensions 这绝对是必要的 iOS 是否支持 MSE Chrome 移动版 F
watchdog(python) - 仅监视一种文件格式并忽略“PatternMatchingEventHandler”中的所有其他内容

我正在运行代码本文 https www thepythoncorner com 2019 01 how to create a watchdog in python to look for filesystem changes 并进行了一些
设置Jest和Enzyme来测试React 15找不到模块react/lib/ReactTestUtils

我有一个反应项目正在尝试设置一些测试由于以下设置指南问题 https github com facebook jest issues 1353 https github com facebook jest issues 1353 ht
对指定月份和年份的数据框进行子集化

我有一个数据框其中第一列是 d m y 格式的日期第二列是数值销售额我想为一年中的每个月创建子集例如 11 11 12 11 等我尝试了这个答案中建议的代码使用多个条件对 data frame 进行子集化 https stac
仅从 perl 列表中获取某些值

首先我会描述我所拥有的然后是问题我有一个这样构造的文本文件 Start of file name name2 ignore name4 jojobjim name3 name6 name9 pop gt
我如何从ajax调用web api控制器

我是 ASP MVC 和 Web api 的初学者通过使用下面的代码我尝试调用在控制器中编写的函数为了进行检查我使用了断点因此控件无法转到控制器因此我无法跟踪实际发生的情况给定的代码解释了如何将用户名和密码传递给控制器
Python正则表达式不匹配http://

我面临匹配和替换某些单词的问题这些单词未包含在 http 中当前正则表达式 http s 这符合模式http www egg1 com http www egg2 com http www egg2 com 我需要一个正则表达式来匹配

Python正则表达式不匹配http://

Python正则表达式不匹配http:// 的相关文章

随机推荐

热门标签