字符串的正则表达式

2024-06-09

我想在Python中分割字符串。

示例字符串：

大家好，这是第一幕。场景 1 和场景 2，这是第二幕。场景 1 和场景 2 及更多

进入以下列表：

['Hi this is', 'ACT I. SCENE 1', 'and', 'SCENE2', 'and this is', 'ACT II. SCENE 1',
 'and' , 'SCENE 2', 'and more']

有人可以帮我构建正则表达式吗？我构建的一个是：

(ACT [A-Z]+.\sSCENE\s[0-9]+)]?(.*)(SCENE [0-9]+)

但这不能正常工作。

如果我正确理解您的要求，您可以使用以下模式：

(?:ACT|SCENE).+?\d+|\S.*?(?=\s?(?:ACT|SCENE|$))

Demo https://regex101.com/r/XVkTkH/1.

分解：

(?:                    # Start of a non-capturing group.
    ACT|SCENE          # Matches either 'ACT' or 'SCENE'.
)                      # Close the non-capturing group.
.+?                    # Matches one or more characters (lazy matching).
\d+                    # Matches one or more digits.
|                      # Alternation (OR).
\S                     # Matches a non-whitespace character (to trim spaces).
.*?                    # Matches zero or more characters (lazy matching).
(?=                    # Start of a positive Lookahead (i.e., followed by...).
    \s?                # An optional whitespace character (to trim spaces).
    (?:ACT|SCENE|$)    # Followed by either 'ACT' or 'SCENE' or the end of the string.
)                      # Close the Lookahead.

Python 示例：

import re

regex = r"(?:ACT|SCENE).+?\d+|\S.*?(?=\s?(?:ACT|SCENE|$))"
test_str = "Hi this is ACT I. SCENE 1 and SCENE 2 and this is ACT II. SCENE 1 and SCENE 2 and more"

list = re.findall(regex, test_str)
print(list)

Output:

['Hi this is', 'ACT I. SCENE 1', 'and', 'SCENE 2', 'and this is', 'ACT II. SCENE 1', 'and', 'SCENE 2', 'and more']

在线尝试一下 https://rextester.com/LIAJC22538.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

字符串的正则表达式的相关文章

查找数据集中的异常值

我有一个 python 脚本它创建服务器正常运行时间和性能数据列表的列表其中每个子列表或行包含特定集群的统计信息例如格式良好的它看起来像这样 Cluster Availability Requests Sec Errors S
Ruby 相当于 Python 的多处理模块是什么？

为了在 Ruby 或 Python 中获得真正的并发性我需要创建新的进程 Python 使用以下命令使这变得非常简单multiprocessing模块它抽象了所有 fork wait 的好处让我专注于我的代码 Ruby 有类似的东西吗
从 java 代码运行 Python 脚本

这是我第一次在java中尝试python 我正在尝试从我的代码执行 python 脚本如下所示 Process process Runtime getRuntime exec python C Users username Desktop
python 函数 *args 和 **kwargs 以及其他指定的关键字参数

我有一个 Python 类它的方法应该以这种方式接受参数和关键字参数 class plot def init self x y self x x self y y def set axis self args xlabel x ylabe
在 Python 中解压存档时出现错误

我使用 Python 下载 bz2 文件然后我想使用以下方法解压存档 def unpack file dir file cwd os getcwd os chdir dir print Unpacking file s file cmd
为什么 scikit-learn SVM.SVC() 非常慢？

我尝试使用SVM分类器来训练大约10万个样本的数据但我发现它非常慢甚至两个小时后也没有任何反应当数据集有大约 1k 个样本时我可以立即得到结果我还尝试了 SGDClassifier 和朴素贝叶斯速度相当快几分钟内就得到了结果
使用 pytherejs 嵌入小部件：错误的视角和相机观察

我在用pythreejs可视化一些 3D 模型在 Jupyter 笔记本上可视化模型时一切都按预期进行但是当尝试将小部件嵌入 HTML 文档时我面临两个问题看起来相机在加载时正在查看 0 0 0 而不是预期的那样一旦您与小部件交
Plotly：如何在堆叠条形图顶部显示值的总和以及各个条形值？

我正在尝试在 Python 中的 Plotly Express 中添加每个堆叠条形顶部的总计以及各个条形值 import plotly express as px df px data medals long fig px bar df x
在Python中将月份和年份的列合并为季度和年份的列

我有一个数据框 df Month 1 8 Year 2015 2020 df pd DataFrame data df df 想要将其转变为新列期望的输出 df Month 1 8 Year 2015 2020 Quarter Q1201
如何在Python中将N毫秒添加到日期时间

我正在设置一个日期时间变量 fulldate datetime datetime strptime date time Y m d H M S f 其中日期和时间是适合日期时间性质的字符串如何将此日期时间增加 N 毫秒 Use timed
折叠 numpy 数组除前两个维度之外的所有维度

我有一个可变维度的 numpy 数组例如它可以具有以下形状 64 64 64 64 2 5 64 64 40 64 64 10 20 4 我想要做的是如果维数大于 3 我想将其他所有内容折叠堆叠到第三维中同时保留顺序因此在我上面
pip 升级到 pip 10.x.x 后解析需求文件的正确方法？

所以今天我确实发现随着发布pip 10 x x the req软件包更改了其目录现在可以在下面找到pip internal req 由于通常的做法是使用parse requirements功能在你的setup py从需求文件中安装所有依赖
如何在 shell 脚本中使用正则表达式提取字符串？

我想使用正则表达式提取字符串的一部分例如如何从 name多变的 name a href http www google com here a domain name apply some regex on name Using bash
抓取 Shopee API v4

我有一个最终项目其中我想要检索的数据是通过在shopee上抓取数据来获取的但是当我在隐藏的API上抓取shopee时遇到问题当我在Insomnia脚本上尝试时脚本会运行但是当我尝试时在本地或 google colab 脚本上这是
ValueError：序列太大；不能大于 32

我写了这段代码 from Crypto Cipher import AES import numpy as np import cv2 base64 BLOCK SIZE 16 PADDING pad lambda s s BLOCK SI
tkinter 库 treectrl 转换为 exe 安装程序时出现 cx_freeze 错误

我使用的是 python 版本 3 7 我使用了这个名为 treectrl 的外部库当我运行 py 文件时它工作得很好但是当我使用 cx freeze 转换为 exe 文件时它给了我错误 NomodulleFound 名为 tkint
Maya python 连接选择的属性

我一直在尝试制作一个简单的脚本它将采用两个视口选择然后基本上将第二个视口的旋转连接到第一个我不确定如何正确地从视口选择中为对象创建变量这是我的尝试但不起作用 import maya cmds as cmds sel cmds ls
Python - 将列表作为参数传递给 SQL，以及更多变量

我试图在 python 3 6 中将未知数量的参数传递给 SQL Server 这是我使用 pypyodbc 的代码 cursor cnxn cursor theargs 1033286869 1053474957 1063654630 1
Mac 无法安装 Tensorflow

我检查了我的 pip3 和 python3 版本 tensorflow MacBook Pro de Hector 2 tensorflow hectoresteban pip3 V pip 10 0 1 from Users hector
获取 Flask 中没有端口的请求主机名

我刚刚设法使用 Flask 获取我的应用程序服务器主机名request host and request url root 但这两个字段都返回请求主机名及其端口我想使用仅返回请求主机名的字段方法而无需进行字符串替换如果有没有 We

随机推荐

亚马逊 MWS 订单确认返回错误 25：我们无法处理 XML Feed，因为一项或多项商品无效

我在通过亚马逊 MWS 向亚马逊提交订单确认时遇到一些问题我提交的 XML 是
如何确定 CPYFRMIMPF 命令中使用的 CCSID？

我正在尝试将 IFS 流文件复制到 AS400 数据文件但使用默认的 CCSID 设置复制的数据最终会出现一些奇怪的字符在QSH下使用cat命令可以正确显示流文件的内容所以我怀疑这与CCSID有关我的问题是如何确定在我的情况下使用
如何为 Runnable 分配方法引用值

我有一个关于 Java 8 的问题Runnable public static void main String args Runnable r1 Test t1 Runnable r2 Test t2 Runnable r3 Test t
OpenFileDialog 无法加载 CSV 文件，但可以加载 xls/xlsx Excel 文件 [重复]

这个问题在这里已经有答案了在我的 Windows 窗体应用程序中加载 Excel 文件时我可以加载 xls and xlsx格式很好但是当我选择一个 CSV我收到以下错误 System NullReferenceException 未
Passport + Express + Typescript req.user.email 未定义

嗯我有一个类似的问题this one https stackoverflow com questions 16434893 node express passport req user undefined 我知道这与另一个类似但req
Zend 框架复选框装饰器

我想要完成的是让复选框标签显示在复选框输入字段之后在它们的右侧我现在正在使用这些装饰器 private checkboxDecorators array Label array array data gt HtmlTag array t
这是 ExpressionTrees 的错误吗？ #2

看起来 ExpressionTrees 编译器在许多行为中应该接近 C 规范但与 C 不同的是它不支持从decimal to any enum type using System using System Linq Expression
在 Access 2007 中使用 Group By 计算中位数的最佳方法

我有一个表其中包含一本书然后包含该书的多个价格这是一个高度简化的示例 ID BOOK PRICE 1 BOOK1 10 2 BOOK1 15 3 BOOK1 12 4 BOOK2 8 5 BOOK2 2 我很容易计算平均值但是一定有
Android：无法找到 com.facebook.wakizashi.provider.PlatformProvider 的提供商信息

我现在被困了好几天了我正在 facebook 中使用 PhotoShareDialogBu ilder 我使用了这样的内容提供程序
Electron JS 和 TypeScript - 在主流程中使用 TS-Node

您将如何调整以下脚本以允许电子主进程将 Typescript 与 ts node 一起使用 scripts shell cross env NODE ENV development electron ts node app main ts
Spring Security (3.2.5) HTTP POST 身份验证后不转发到原始请求

我有一个示例 Spring MVC 应用程序由 Spring security Spring 版本 4 0 1 RELEASE Spring security 3 2 5 RELEASE 保护当我作为未经身份验证的用户发送 HTTP G
_启动服务器时 Django 中出现死锁错误

我在启动 python 服务器时多次遇到此错误当我更改任何文件并且服务器再次启动时也会发生这种情况我尝试删除环境并重新创建环境但仍然存在相同的错误 Python 3 5 2 默认 2018 年 11 月 12 日 13 43 14 G
如何在 SQLDataAdapter 中使用更新语句

我正在尝试在构建 sqldataadapter 后运行更新语句我的表中有名为 INIT PHASE 的列如果 INIT PHASE 为空或没有数据那么我想将其设置为 1 我已经尝试过但我似乎无法正确理解更新语句请帮助这是我的代
在 Ruby on Rails 中查找两个日期之间的月数

我有两个 Ruby on Rails DateTime 对象如何找到它们之间的月份数请记住它们可能属于不同年份 date2 year 12 date2 month date1 year 12 date1 month 更多信息请访问htt
如何根据 2D 索引和 1D 值向量替换 Numpy 3D 数组中 z 轴的值

我似乎很难理解数组索引给出了什么我确实有一个 3d 数组如下所示 a 3d np zeros 3 3 3 二维索引数组 a 2d index np array 0 0 1 0 0 0 0 1 1 astype bool 以及要放入 3
如何将 XML 中的数据添加到列表<>？

我尝试从 xml 文件中读取数据但它非常笨拙而且我获得的很多数据都是从孩子那里获取的我将姓名年龄等信息集中在一起因此无法将其添加到列表中我的 xml 文件如下所示
如何映射内存中的_特定_区域？

我有一个程序我希望它能够在不同的运行中映射特定的内存区域我有该程序的源代码 C C 我控制程序的编译方式海湾合作委员会我控制程序的链接方式海湾合作委员会我控制程序的运行方式 Linux 我只想拥有这个特定的内存区域比如 0xa
Laravel php artisan db:seed 导致“use”语句错误

当我尝试跑步时php artisan db seed我收到以下错误 The use statement with non compound name DB has no effect 我已经编写了自己的种子文件我将其包含在下面基于文档中
Chrome AutoSelectCertificateForUrls 主题过滤器

目前遇到与此相同的问题但未得到答复从 2016 年 8 月开始希望在另一个字段例如主题上过滤自动选择的证书 Chromium 文档 https www chromium org administrators policy list 3
字符串的正则表达式

我想在Python中分割字符串示例字符串大家好这是第一幕场景 1 和场景 2 这是第二幕场景 1 和场景 2 及更多进入以下列表 Hi this is ACT I SCENE 1 and SCENE2 and this is

字符串的正则表达式

字符串的正则表达式 的相关文章

随机推荐

热门标签

字符串的正则表达式的相关文章