python中.find函数的使用方法及实例_Python

2023-11-17

re.findall()

findall(string[, pos[, endpos]])

在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。

string 待匹配的字符串。

pos 可选参数,指定字符串的起始位置,默认为 0。

endpos 可选参数,指定字符串的结束位置,默认为字符串的长度。

实例:

>>> pattern = re.compile(r'\d+') # 查找数字

>>> result1 = pattern.findall('runoob 123 google 456')

>>> print(result1)

['123', '456']

>>> result2 = pattern.findall('run88oob123google456', 0, 10)

>>> print(result2)

['88', '12']

函数释义:

>>> help(re.findall)

Help on function findall in module re:

findall(pattern, string, flags=0)

Return a list of all non-overlapping matches in the string.

If one or more capturing groups are present in the pattern, return

a list of groups; this will be a list of tuples if the pattern

has more than one group.

Empty matches are included in the result.

findall()查询字符串中某个正则表达式模式全部的非重复出现情况。这与 search()在执行字符串搜索时类似,但与 match()和 search()的不同之处在于,findall()总是返回一个列表。

如果 findall()没有找到匹配的部分,就返回一个空列表,但如果匹配成功,列表将包含所有成功的匹配部分(从左向右按出现顺序排列)。

>>> re.findall('car', 'car')

['car']

>>> re.findall('car', 'scary')

['car']

>>> re.findall('car', 'carry the barcardi to the car')

['car', 'car', 'car']

re.finditer()

re.finditer(pattern, string, flags=0)

和 findall 类似,在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。

参数

描述

pattern

匹配的正则表达式

string

要匹配的字符串。

flags

标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。参见:正则表达式修饰符 – 可选标志

实例:

>>> it = re.finditer(r'\d+', '12a32bc43jf3')

>>> for match in it:

print(match.group())

12

32

43

3

函数释义:

>>> help(re.finditer)

Help on function finditer in module re:

finditer(pattern, string, flags=0)

Return an iterator over all non-overlapping matches in the

string. For each match, the iterator returns a Match object.

Empty matches are included in the result.

finditer()函数是在 Python 2.2 版本中添加回来的,这是一个与 findall()函数类似但是更节省内存的变体。两者之间以及和其他变体函数之间的差异(很明显不同于返回的是一个迭代器还是列表)在于,和返回的匹配字符串相比,finditer()在匹配对象中迭代。

如下是在单个字符串中两个不同分组之间的差别:

>>> s = 'This and that.'

>>> re.findall(r'(th\w+) and (th\w+)', s, re.I)

[('This', 'that')]

>>> re.finditer(r'(th\w+) and (th\w+)', s,re.I).__next__().groups()

('This', 'that')

>>> re.finditer(r'(th\w+) and (th\w+)', s,re.I).__next__().group(1)

'This'

>>> re.finditer(r'(th\w+) and (th\w+)', s,re.I).__next__().group(2)

'that'

>>> [g.groups() for g in re.finditer(r'(th\w+) and (th\w+)',s, re.I)]

[('This', 'that')]

类似写法:

>>> for g in re.finditer(r'(th\w+) and (th\w+)',s, re.I):

print(g.groups())

('This', 'that')

如下是单个字符串中执行单个分组的多重匹配:

>>> s = 'This and that.'

>>> it = re.finditer(r'(th\w+)', s, re.I)

>>> g = it.__next__()

>>> g.groups()

('This',)

>>> g.group()

'This'

>>> g = it.__next__()

>>> g.groups()

('that',)

>>> g.group(1)

'that'

>>> [g.group(1) for g in re.finditer(r'(th\w+)', s, re.I)]

['This', 'that']

注意:

使用 finditer()函数完成的所有额外工作都旨在获取它的输出来匹配 findall()的输出。

最后 ,与 match()和 search()类似,findall()和 finditer()方法的版本支持可选的 pos 和 endpos参数,这两个参数用于控制目标字符串的搜索边界,这与本章之前的部分所描述的类似。

引申:分组的深入理解

先看下案例

import re

phoneRegex = re.compile(r'''( # 第一行 (group1

(\d{3}|\(\d{3}\))? # 区号 (group2)

(\s|-|\.)? # 分隔符 (group3)

(\d{3}) # 前3个数字 (group4)

(\s|-|\.) # 分隔符 (group5)

(\d{4}) # 后4个数字 (group6)

(\s*(ext|x|ext.)\s*(\d{2,5}))? # 扩展名 (group7(group8)(group9))

)''', re.VERBOSE) # 自后一行 )

text = '(111)-222-3333 x 444'

lp = phoneRegex.findall(text)

print(lp)

输出结果为:

[('(111)-222-3333 x 444', '(111)', '-', '222', '-', '3333', ' x 444', 'x', '444')]

这是一个含有1个元组的列表,这1个元组中包含9个元素,即为compile的9个小括号,也即9个group(),见代码注释。

>>> phoneRegex = re.compile(r'''( # 第一行 (group1

(\d{3}|\(\d{3}\))? # 区号 (group2)

(\s|-|\.)? # 分隔符 (group3)

(\d{3}) # 前3个数字 (group4)

(\s|-|\.) # 分隔符 (group5)

(\d{4}) # 后4个数字 (group6)

(\s*(ext|x|ext.)\s*(\d{2,5}))? # 扩展名 (group7(group8)(group9))

)''', re.VERBOSE) # 自后一行 )

>>> re.search(phoneRegex, '(111)-222-3333 x 444')

>>> lp = re.search(phoneRegex, '(111)-222-3333 x 444')

>>> lp.group()

'(111)-222-3333 x 444'

>>> lp.group(1)

'(111)-222-3333 x 444'

>>> lp.group(2)

'(111)'

>>> lp.group(3)

'-'

>>> lp.group(4)

'222'

>>> lp.group(5)

'-'

>>> lp.group(6)

'3333'

>>> lp.group(7)

' x 444'

>>> lp.group(8)

'x'

>>> lp.group(9)

'444'

>>> lp.group(10)

Traceback (most recent call last):

File "", line 1, in

IndexError: no such group

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python中.find函数的使用方法及实例_Python 的相关文章

  • ESP8266使用AT指令连接MQTT服务器

    注 不同的AT固件在使用时存在差异 此处使用的是安信可官方提供的MQTT透传AT固件 固件号 1471 本文为学习记录 仅作参考 如有不对之处 请留言 附 固件地址 AT固件汇总 安信可科技 ai thinker com https doc
  • JSON.parse()方法

    一 JSON的解析方法有两种 eval 和JSON parse var jsonstr str1 Hello str2 world var evalJson eval jsonstr var jsonParseJson JSON parse
  • python获取矩阵某一列元素

    今天写线性回归问题的时候遇到了一个问题 对于一个二维矩阵 python如何遍历其某一列元素 遍历一行是很简单的 直接使用索引即可 但是遍历一列呢 方法一 直接遍历法 使用一个循环 对每一行单独找出这列上的对应元素 方法二 列表解析法 这个方
  • webpack 常用配置

    环境搭建 既然是前端项目 那么就npm就必不可少 运行 npm install webpack cli g 来全局安装脚手架 随后使用 npm install webpack cli D 安装到工程下 在工程目录下创建 webpack co
  • stm32专题二十六:输入捕获 脉宽测量

    硬件设计 脉宽测量原理 当按键没有按下时 由硬件电路自动拉低 如果按键按下 则PA0产生上升沿 我们进行脉宽测量时 首先设置为上升沿捕获 然后在第一次捕获到上升沿时 将计数器清零 并设置捕获极性为下降沿捕获 当第二次捕获到信号时 就是一个完
  • Vigenere密码

    Vigenere密码技术 在单字符单表替换密码中 明文中的字符与密文中字符是一一对应的 在明文表中的字符也存在于在密文表中 明文中字符的统计特性在密文中没有得到改变 单字符多表替换密码技术是用一系列 两个以上 替换表依次对明文的字符进行替换
  • 跟据后台数据生成饼图及柱形图实例

    在做社团管理系统时 为了进一步完善功能 用jfreechar做了一个饼图与柱形图 做的比较粗糙 效果如下 现在跟大家分享一下实现方法 生成饼图 param list 传入参数为一个list list中包含多个map 这个list是从数据库中
  • ZooKeeper系统模型之集群间消息通信。

    ZooKeeper的消息类型大体上可以分为四类 分别是 数据同步型 服务器初始化型 请求处理型和会话管理型 数据同步型 数据同步型消息是指在Learner和Leader服务器进行数据同步的时候 网络通信所用到的消息 通常有DIFF TRUN
  • java 仓库管理_Java仓库管理系统(一)

    从小到大没有写日记的习惯 但本着互联网开放 共享的原则 并且马士兵老师曾说 当你学会一些技能的时候 看到别人正被你会的东西所困扰 你应该去帮助他 所以把仓库管理系统的详解记录一下 说的可能不那么专业 但基本都能听懂 本人编程起步 有错误请指
  • 常见手机快充协议介绍

    早在几年前 各厂家就在逐步推进手机的充电速度 随着QC PD等一系列的充电协议不断更新 各家手机厂家都有自己的快充解决方案 不仅功率不一样 手机间的充电协议与标准也变得越发复杂 不同品牌的手机快充名称也各有不同 所以我们需要先清楚我们的手机
  • 垃圾箱清空后数据恢复(亲测有效)

    辛辛苦苦写PPT写了两周 误删了还没发现 然后顺便把垃圾箱也清空了 wps还因为云空间已满不能同步上传 连个记录都没有 真的是差点气到心梗 经历了一个小时的百度 恢复了我的PPT 记录一下数据的恢复过程 无图 恢复的时候过于烦躁 忘记截图
  • STM32单片机IAP介绍

    1 什么是IAP 首先区分下两个概念 ISP和IAP ISP In System Programming 在系统中编程 通过芯片专用的串行编程接口对其内部的程序存储器进行擦写 IAP In Application Programming 在
  • Unity中UGUI的Text实现超链接点击的解决方案

    Unity实现超链接点击 功能简介 C 脚本 使用方法 Demo工程内截图 Demo地址 功能简介 1 同一个Text内可以实现多个不同字符区域的点击 2 适配了中文 英文 韩文 日文 阿拉伯语等 更多语种待测试 C 脚本 文件名 UITe
  • uni-app 微信小程序vendor.js 过大的处理方式和分包优化

    小程序工具提示vendor js过大 已经跳过es6向es5转换 这个转换问题本身不用理会 因为vendor js已经是es5的了 关于体积控制 参考如下 使用运行时代码压缩 HBuilderX创建的项目勾选运行 gt 运行到小程序模拟器
  • Shell脚本编写教程【二】——Shell 数组

    Shell脚本编写教程 二 Shell 数组 目录 https blog csdn net shn111 article details 131590488 参考教程 https www runoob com linux linux she
  • colmap利用已知的相机内外参数重建场景

    Colmap根据相机内外参数重建稀疏模型 COLMAP稀疏重建得图像内外参文件 colmap model converter input path output path output type TXT
  • android 蓝牙ble 133,java – Android蓝牙错误133

    我正在尝试连接到 Android上的蓝牙设备 我在onClientConnectionState处理程序中收到状态133 我并不总是得到这个错误 有时连接很好 我无法指出触发问题的原因 重新启动设备和我的repro应用程序后 我甚至立即使用
  • 对于长度为5位的一个01串,每一位都可能是0或1,一共有32种可能。(蓝桥杯)

    题描述 对于长度为5位的一个01串 每一位都可能是0或1 一共有32种可能 它们的前几个是 00000 00001 00010 00011 00100 请按从小到大的顺序输出这32种01串 输入格式 本试题没有输入 输出格式 输出32行 按
  • 基于光标读取xml stax入门

    StAX 概述 从一开始 Java API for XML Processing JAXP 就提供了两种方法来处理 XML 文档对象模型 DOM 方法是用标准的对象模型表示 XML 文档 Simple API for XML SAX 方法使

随机推荐

  • 基于实时迭代的数值鲁棒NMPC双模稳定预测模型(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 Matlab代码实现 4 参考文献 1 概述 本文 T 秒进行 N 次模拟 使用提出的使
  • 计算机二级小蒋在教务处负责学生成绩,小蒋是一位中学教师,在教务处负责初一年级学生的成绩管理。由于学校地处偏远地区..._考试资料网...

    小蒋是一位中学教师 在教务处负责初一年级学生的成绩管理 由于学校地处偏远地区 缺 乏必要的教学设施 只有一台配置不太高的PC可以使用 他在这台电脑中安装了Microsoft Office 决定通过Excel来管理学生成绩 以弥补学校缺少数据
  • 电子企业应该先实施ERP系统还是WMS仓储管理系统

    电子企业应该先实施ERP系统还是WMS仓储管理系统 这是一个有争议的问题 不同的企业和管理专家有不同的看法 但是 从我个人的观点来看 电子企业应该先实施ERP系统 然后再考虑WMS仓储管理系统 首先 ERP系统是企业资源规划 Enterpr
  • React Native: 添加外部字体

    iOS 1 字体文件加入到Xcode项目中 2 确认字体文件包含在目标中 点击字体文件 查看是否在右栏的 Target Membership中选择了改字体 3 检查字体是否在打包的资源中 在Build Phases中查看字体是否添加在Cop
  • c++ point类(含输入和输出的重载)

    问题描述 定义类point 其中包括两个数据成员 均为 int 类型 为点的横坐标和纵坐标 类的成员函数如下 构造函数 包括两个参数 其两个参数的默认值为0 重载运算符 两个点相应的坐标相加 比如 1 1 2 2 3 3 两个点相应的坐标相
  • 华为OD机试真题- 目录删除-2023年OD统一考试(B卷)

    题目描述 某文件系统中有N个目录 每个目录都一个独一无二的ID 每个目录只有一个父目录 但每个父目录下可以有零个或者多个子目录 目录结构呈树状结构 假设 根目录的ID为0 且根目录没有父目录 其他所有目录的ID用唯一的正整数表示 并统一编号
  • 升级需谨慎,开发两行泪!——记一次MySQL驱动包升级引发的事故

    一 背景 最近项目组在版本迭代时 组件也要进行升级 此时涉及到MySQL驱动包jdbc的版本升级 即从5 1 X升级到8 0 X 然鹅在上线之后就出现了一部分兼容性问题 造成了一次 事故 调用接口出现 系统错误 查看日志 java time
  • Idea中Springboot开启热部署方法

    Springboot1 3后支持热部署 具体方法如下 1 增加依赖
  • 【Java学习笔记】70:借助Redis实现分布式锁

    这节学习Java用Redis做分布式锁 来做秒杀场景卖货减库存的案例 最原始的减库存写法 这里库存也存Redis里面 调减库存接口的时候判断一下大于0 还有库存 就拿出来减1 这里StringRedisTemplate是Spring Boo
  • elasticsearch的映射 (mapping)

    一 概念 映射 mapping 就是指定索引 index 里面的每个文档中的字段的类型 设置字段的存储和查询的分析策略 es对不同的字段类型 有不同的存储和检索策略 比如对于text类型的字段 会经过各类分词处理 大小写转换 同义词转换 才
  • VTK5.10.1+Cmake+vs2010整合安装

    1 下载 VS2010就自己在网上找了咯 这里不提供具体路径下载了 vtk 5 10 1 zip源程序 vtkdata 5 10 1 zip 数据 vtkDocHtml 5 10 1 tar gz 文档可以不下载 vtk相关安装程序下载 h
  • MySQL基础高频面试题

    1 什么是索引 索引是一种用于快速查询和检索数据的数据结构 mysql中的索引结构有 B 树和Hash 索引的作用就相当于目录的作用 我们只需要先去目录里查找字的位置 然后直接翻到那一页就行了 这样查找就会非常快 2 索引的优缺点 优点 1
  • JavaWeb之HTML和CSS

    标签命令汇总 tr 行 td 单元格 b 加粗 font 字体标签 br 换行 a 超链接标签 ul 无序标签列表 ol 有序标签列表 li list ul 无序标签列表 href 设置链接地址 一 概述 1 B S软件结构 JavaSE中
  • 欧拉习题40

    题目如下 An irrational decimal fraction is created by concatenating the positive integers 0 12345678910111213141516171819202
  • CVPR-2022- MixFormer: End-to-End Tracking with Iterative Mixed Attention 阅读笔记

    目录 端到端的MixFormer跟踪整体框架 Mixed attention module MAM 基于角的定位头 基于查询的定位头 分数预测模块 SPM 论文地址 https arxiv org abs 2203 11082 代码地址 h
  • Java对象的序列化和反序列化实践

    当两个进程在进行远程通信时 彼此可以发送各种类型的数据 无论是何种类型的数据 都会以二进制序列的形式在网络上传送 发送方需要把这个Java对象转换为字节序列 才能在网络上传送 接收方则需要把字节序列再恢复为Java对象 把Java对象转换为
  • OrCAD打开工程报错-ERROR(ORCAP-1653)

    OrCAD打开工程报错 ERROR ORCAP 1653 OrCAD打开工程报错 ERROR ORCAP 1653 1 简要介绍 2 报错原因 3 解决方法 1 简要介绍 长期使用 OrCAD 以来都比较顺手 不知什么时候开始打开某些原理图
  • 解决hikari连接池一段时间不操作断开连接的问题

    起因 在自己项目中隔一段时间不操作数据库就会报错导致数据库连不上 报错信息 报错信息显示30207ms 差不多是30s 主要原因是因为我是用的SpringBoot版本使用的连接池是hikari 由其中一个属性connectionTimeou
  • Endnote 与word关联

    适用于endnotex7 endnotex8 endnotex9和office2019 office2021 第一步 打开Word 选择 选项 单击转到下一页 第二步 选择 加载项 COM加载项 转到 进入下一页 第三步 添加 可用加载项
  • python中.find函数的使用方法及实例_Python

    re findall findall string pos endpos 在字符串中找到正则表达式所匹配的所有子串 并返回一个列表 如果没有找到匹配的 则返回空列表 string 待匹配的字符串 pos 可选参数 指定字符串的起始位置 默认