在 Python 中使用正则表达式替换除特定元素之外的所有元素

2024-01-16

在Python中使用正则表达式，我试图删除字符串中的所有XML类型元素，除了那些包含QUOTE的元素，例如<QUOTE>, </QUOTE> or <QUOTE A="B">应该保留，但其他诸如<EXAMPLE> or <TEST A="B">应该被删除。我创建了这个，它替换了所有元素，但无法计算出 not 部分：

re.sub(r'</?[\w= \-"]+>', '', s)

有人有什么想法吗？

我相信否定的前瞻断言会满足您的需求：

import re

regex = r'<(?!/?QUOTE\b)[^>]+>'

tests = [
    'a plain old string',
    'a string with <SOME> <XML TAGS="stuff">',
    'a string with <QUOTE>, </QUOTE>, and <QUOTE with="data">',
    'a string that has <QUOTEA> tags </QUOTEB>',
]

for i in tests:
    result = re.sub(regex, '', i)
    print('{}\n{}\n'.format(i, result))

编辑：它是如何工作的

前瞻断言，顾名思义，在匹配的字符串中“前瞻”，但不消耗它们匹配的字符。你可以做积极的事（(?=...)) 和负 ((?!...)) 前瞻。（也有积极和消极的回顾断言。）

所以，显示的正则表达式匹配<对于标签的开头，然后对QUOTE带有可选的/在它之前（/?) 及其后面的单词边界 (\b）。如果匹配，则正则表达式不匹配，并且该标记将被忽略。如果不匹配，正则表达式会继续吃掉一个或多个非>人物和结尾>。我想你可能也想让它吃掉标签后面的任何空格——我没有这样做。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

在 Python 中使用正则表达式替换除特定元素之外的所有元素的相关文章

与区域指示符字符类匹配的 python 正则表达式

我在 Mac 上使用 python 2 7 10 表情符号中的标志由一对表示区域指示符号 https en wikipedia org wiki Regional Indicator Symbol 我想编写一个 python 正则表达式来在
元组有什么用？

我现在正在学习 Python 课程我们刚刚介绍了元组作为数据类型之一我阅读了它的维基百科页面但是我无法弄清楚这种数据类型在实践中会有什么用处我可以提供一些需要一组不可变数字的示例吗也许是在 Python 中这与列表有何不同每
正则表达式获取字符串中的第一个数字和其他字符

我是正则表达式的新手想知道如何才能只获取字符串中的第一个数字例如100 2011 10 20 14 28 55 在这种情况下我希望它返回100 但该数字也可以更短或更长我在想类似的事情 0 9 但它单独获取每个数字 100 2001
netsh 结果到 PowerShell 对象

我正在尝试与NETSH https ss64 com nt netsh html来自 PowerShell 我想看到这个命令的结果例如一个对象但是netsh返回一个字符串 netsh wlan show hostednetwork Ge
需要在python中找到print或printf的源代码[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我正在做一些我不能完全谈论的事情我
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
Pandas Merge (pd.merge) 如何设置索引和连接

我有两个 pandas 数据框 dfLeft 和 dfRight 以日期作为索引 dfLeft cusip factorL date 2012 01 03 XXXX 4 5 2012 01 03 YYYY 6 2 2012 01 04 XX
Golang 正则表达式在字符串之间替换

我有一些可能采用以下形式的字符串 MYSTRING MYSTRING n MYSTRING n MYSTRING randomstringwithvariablelength n 我希望能够将其正则表达式为MYSTRING foo 基本上替
使用 xlrd 打开 BytesIO (xlsx)

我正在使用 Django 需要读取上传的 xlsx 文件的工作表和单元格使用 xlrd 应该可以但因为文件必须保留在内存中并且可能不会保存到我不知道如何继续的位置本例中的起点是一个带有上传输入和提交按钮的网页提交后文件被捕获req
Python beautifulsoup 仅限 1 级文本

我看过其他 beautifulsoup 得到相同级别类型的问题看来我的有点不同这是网站我正试图拿到右边那张桌子请注意表的第一行如何展开为该数据的详细细分我不想要那个数据我只想要最顶层的数据您还可以看到其他行也可以展开但在本例
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
Cython 和类的构造函数

我对 Cython 使用默认构造函数有疑问我的 C 类 Node 如下 Node h class Node public Node std cerr lt lt calling no arg constructor lt lt std e
pip 列出活动 virtualenv 中的全局包

将 pip 从 1 4 x 升级到 1 5 后pip freeze输出我的全局安装系统软件包的列表而不是我的 virtualenv 中安装的软件包的列表我尝试再次降级到 1 4 但这并不能解决我的问题这有点类似于这个问题 http
为什么这些非捕获正则表达式组不能正常工作？

所以我花了很多时间在另一个堆栈溢出问题上同样的问题又出现在上一个问题上非捕获组并没有像我期望的那样工作至少我是这么认为的这是一个愚蠢的例子类似于其他人的 CSS 测试字符串这是我的正则表达式 rgb S 这是测试字符串 1px
如何在 pygtk 中创建新信号

我创建了一个 python 对象但我想在它上面发送信号我让它继承自 gobject GObject 但似乎没有任何方法可以在我的对象上创建新信号您还可以在类定义中定义信号 class MyGObjectClass gobject GO
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
使用for循环时如何获取前一个元素？ [复制]

这个问题在这里已经有答案了可能的重复 Python 循环内的上一个和下一个值 https stackoverflow com questions 1011938 python previous and next values inside
Django-tables2 列总计

我正在尝试使用此总结列中的所有值文档 https github com bradleyayers django tables2 blob master docs pages column headers and footers rst 但页
使用随机放置的 NaN 创建示例 numpy 数组

出于测试目的我想创建一个M by Nnumpy 数组与c随机放置的 NaN import numpy as np M 10 N 5 c 15 A np random randn M N A mask np nan 我在创建时遇到问题mas

随机推荐

NSInvocableOperation 和 NSBlockOperation 有什么区别

Foundation Framework中共有三个操作类 NSOperation NSInvocationOperation and NSBlockOperation 我已经读过并发编程指南 https developer apple co
threading.Timer - 每“n”秒重复一次函数

我想每 0 5 秒触发一个函数并且能够启动停止和重置计时器我不太了解 Python 线程的工作原理并且在使用 Python 计时器时遇到困难然而我不断得到RuntimeError threads can only be star
使用 OrientDB 递归遍历有向边

我正在尝试从给定节点递归遍历出站边缘而不是入站边缘我想要查询结果中包含出边和出顶点下图中从 a 开始我需要 a b c d e 包括边缘但不包括 c 之后的部分即 lt x a gt b gt c lt x gt d gt e
跟踪嵌入的 YouTube 视频观看次数

我在我的网站中嵌入了一些 YouTube 视频我想使用 google Analytics 跟踪每个视频的观看次数但我无法捕获任何 onClick 事件因为视频是使用 iFrame 嵌入的如何使用 iFrame 跟踪嵌入在我的网页中的
React-router 链接不起作用

React router 的起步非常糟糕看起来基本的东西不起作用使用react router 2 0 0我的Link组件将URL更新为 about 但我的页面在那之后不会渲染About组件入口点js var React require
使用 Moq 模拟 EF DbContext

我正在尝试使用模拟的 DbContext 为我的服务创建单元测试我创建了一个界面IDbContext具有以下功能 public interface IDbContext IDisposable IDbSet
跨浏览器 nowrap 文本区域

我正在寻找一种跨浏览器解决方案文本区域文字换行only输入时滚动条都隐藏直到文本溢出我已经尝试了几乎所有可以在SO中找到的东西失败 1 textarea white space nowrap overflow auto 在 FF
最好的免费测试跟踪软件是什么？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Vuejs 和 Vue.set()，更新键/值数组

我想弄清楚如何this set aka Vue set api 在使用它更新多维数组时起作用 Given new Vue el app data rows id 4 edit true id 5 edit false 我将如何使用 this
为什么 data.tables mutate(row_number()) 失败？

当我尝试使用时row number from dplyr在 data table 上它会抛出错误这是一个例子 library dplyr library data table mine lt data table a 1 10 mine
通过正则表达式解析CSS

我正在创建一个 CSS 编辑器并尝试创建一个可以从 CSS 文档获取数据的正则表达式如果我有一个属性则此正则表达式有效但无法让它适用于所有属性我在 PHP 中使用 preg perl 语法 Regex
有人使用过 __COUNTER__ 预处理器宏吗？

The COUNTER 符号由提供VC http msdn microsoft com en us library b0084kay VS 80 aspx和GCC 并且每次使用时都会给出一个递增的非负积分值我有兴趣了解是否有人使用过它以
如何找出当前的溢出检查上下文？

有没有办法在 C 中做到这一点例如如果调用您的方法并且您想知道调用者是否已将方法调用放入已检查的块中 checked unchecked块始终是方法的本地块关键字影响如何为块中的语句和表达式生成 IL 它不会传播到调用的方法并且无法
如何在 Google Drive 上为 Google Colab 安装 conda？

wget https repo anaconda com miniconda Miniconda3 py37 4 8 2 Linux x86 64 sh chmod x Miniconda3 py37 4 8 2 Linux x86 64
Linq、表达式、NHibernate 和 Like 比较

我试图根据确定比较类型的外部参数通过搜索表单传递进行类似的比较 string or string or string 我朝以下方向思考 query query Where Entity StringProperty Like Searc
setItemWidget 导致崩溃

我正在尝试添加一个QLabel to a QTreeWidgetItem但Python崩溃了setItemWidget call 有什么想法为什么会崩溃吗这是代码 from PySide import QtCore QtGui view
如何使用 pyglet 显示 numpy 数组？

我有一个尺寸为 100 100 的标签矩阵存储为 numpy 数组我想用 pyglet 显示该矩阵我最初的想法是使用这个矩阵通过函数 pyglet image ImageData 形成一个新的 pyglet 图像它需要图像数据的缓冲
如何在本地加载 wasm 模块？

我正在尝试使用 JavaScript 和 WebAssembly 制作一个简单的独立的只有一个 html 文件和一个 wasm 文件离线数据可视化但是我在从本地文件加载 WASM 模块时遇到问题第一个麻烦是CORS 尝试使用亲戚
使用rentrez从pubmed中解析出作者和隶属关系

我的总体目标是构建一个共同作者网络图我有一份 PubMed ID 列表这些是我唯一对绘制合著者网络图表感兴趣的出版物我不知道如何使用rentrez 在查询中将作者姓名和各自的隶属关系放在一起我可以获得这两个信息但我的隶属关系列表比
在 Python 中使用正则表达式替换除特定元素之外的所有元素

在Python中使用正则表达式我试图删除字符串中的所有XML类型元素除了那些包含QUOTE的元素例如

在 Python 中使用正则表达式替换除特定元素之外的所有元素

在 Python 中使用正则表达式替换除特定元素之外的所有元素 的相关文章

随机推荐

热门标签

在 Python 中使用正则表达式替换除特定元素之外的所有元素的相关文章