替换单词和字符串 pandas

2024-01-23

    dataframe = pd.DataFrame({'Date':['This 1A1619 person BL171111 the A-1-24',
                                  'dont Z112 but NOT 1-22-2001',
                                  'mix: 1A25629Q88 or A13B ok'], 
                          'IDs': ['A11','B22','C33'],
                          }) 

           Date                                 IDs
0   This 1A1619 person BL171111 the A-1-24      A11
1   dont Z112 but NOT 1-22-2001                 B22
2   mix: 1A25629Q88 or A13B ok                  C33

我有上面的数据框。我的目标是替换所有不带连字符的混合单词/数字组合- e.g. 1A1619I or BL171111 or A13B但不是1-22-2001 or A-1-24与这封信M。我尝试通过使用下面的代码使用正则表达式识别字母/数字组合并存储在字典中 https://stackoverflow.com/questions/57650538/identify-letter-number-combinations-using-regex-and-storing-in-dictionary

dataframe['MixedNum'] = dataframe['Date'].str.replace(r'(?=.*[a-zA-Z])(\S+\S+\S+)','M') 

但我得到这个输出

                          Date              IDs     MixedNum
0   This 1A1619 person BL171111 the A-1-24  A11     M M M M M M M
1   dont Z112 but NOT 1-22-2001             B22     M M M M 1-22-2001
2   mix: 1A25629Q88 or A13B ok              C33     M M or M ok

当我真的想要这个输出时

                          Date              IDs     MixedNum
0   This 1A1619 person BL171111 the A-1-24  A11     This M person M the A-1-24 
1   dont Z112 but NOT 1-22-2001             B22     dont M but NOT 1-22-2001
2   mix: 1A25629Q88 or A13B ok              C33     mix: M or M ok

我也尝试了这里建议的正则表达式,但它对我也不起作用正则表达式替换混合数字+字符串 https://stackoverflow.com/questions/13453999/regex-replace-mixed-numberstrings

谁能帮我改变我的正则表达式?r'(?=.*[a-zA-Z])(\S+\S+\S+


您可以使用

pat = r'(?<!\S)(?:[a-zA-Z]+\d|\d+[a-zA-Z])[a-zA-Z0-9]*(?!\S)'
dataframe['MixedNum'] = dataframe['Date'].str.replace(pat, 'M')

Output:

>>> dataframe
                                     Date  IDs                    MixedNum
0  This 1A1619 person BL171111 the A-1-24  A11  This M person M the A-1-24
1             dont Z112 but NOT 1-22-2001  B22    dont M but NOT 1-22-2001
2              mix: 1A25629Q88 or A13B ok  C33              mix: M or M ok

图案细节

  • (?<!\S)- 空格或字符串开头应紧接在当前位置之前
  • (?:[a-zA-Z]+\d|\d+[a-zA-Z]) - either
    • [a-zA-Z]+\d- 1+ 个字母和一个数字
    • | - or
    • \d+[a-zA-Z]- 1+位数字和一个字母
  • [a-zA-Z0-9]*- 0+数字或字母
  • (?!\S)- 空格或字符串结尾应紧跟在当前位置之后。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

替换单词和字符串 pandas 的相关文章

  • 检测两个正则表达式是否可能匹配相同的字符串[重复]

    这个问题在这里已经有答案了 给定两个正则表达式 是否可以检测是否存在与它们都匹配的可能字符串 例如 给定正则表达式A and 我可以看到那个字符串 A 匹配他们两个 这是一个简单的案例 我的问题是针对更广泛的情况 给定任何两个有效的正则表达
  • 为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误,而在 2.7 中却不会?

    我有一个程序 当在 Python 2 7 中运行时 会生成正确的 Unicode 输出到标准输出 当在 Python 2 4 中运行时 我得到UnicodeEncodeError ascii codec can t encode chara
  • 对图像块进行多重处理

    我有一个函数必须循环遍历图像的各个像素并计算一些几何形状 此函数需要很长时间才能运行 在 24 兆像素图像上大约需要 5 小时 但似乎应该很容易在多个内核上并行运行 然而 我一生都找不到一个有据可查 解释充分的例子来使用 Multiproc
  • 如何通过php获取网页的Open Graph协议?

    PHP 有一个简单的命令来获取网页的元标记 get meta tags 但这仅适用于具有名称属性的元标记 然而 开放图谱协议如今变得越来越流行 从网页获取 opg 值的最简单方法是什么 例如 我看到的基本方法是通过 cURL 获取页面并使用
  • 按元组分隔符拆分列表

    我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
  • 将 JSON 对象传递给带有请求的 url

    所以 我想利用 Kenneth 的优秀请求模块 https github com kennethreitz requests 在尝试使用时偶然发现了这个问题自由库API http wiki freebase com wiki API 基本上
  • 在 Pandas 中使用正则表达式的多种模式

    我是Python编程的初学者 我正在探索正则表达式 我正在尝试从 描述 列中提取一个单词 数据库名称 我无法给出多个正则表达式模式 请参阅下面的描述和代码 描述 Summary AD1 Low free DATA space in data
  • 创建嵌套字典单行

    您好 我有三个列表 我想使用一行创建一个三级嵌套字典 i e l1 a b l2 1 2 3 l3 d e 我想创建以下嵌套字典 nd a 1 d 0 e 0 2 d 0 e 0 3 d 0 e 0 b a 1 d 0 e 0 2 d 0
  • 使用 Firefox 绕过弹出窗口下载文件:Selenium Python

    我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
  • 使用yield 进行字典理解

    作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
  • 默认情况下,Keras 自定义层参数是不可训练的吗?

    我在 Keras 中构建了一个简单的自定义层 并惊讶地发现参数默认情况下未设置为可训练 我可以通过显式设置可训练属性来使其工作 我无法通过查看文档或代码来解释为什么会这样 这是应该的样子还是我做错了什么导致默认情况下参数不可训练 代码 im
  • 迭代 my_dict.keys() 并修改字典中的值是否会使迭代器失效?

    我的例子是这样的 for my key in my dict keys my dict my key mutate 上述代码的行为是否已定义 假设my dict是一本字典并且mutate是一个改变其对象的方法 我担心的是 改变字典中的值可能
  • 使用FFMpeg确定视频类型,然后进行转换?

    我正在尝试以编程方式确定文件的真实类型 看来我必须使用 FFMPeg 来实现这一点 我想确定上传的文件实际上是否是 MP4 或 FLV 对于 Flash 视频 或 WebM 对于 HTML5 我知道 FFMPeg 中的 i 运算符 但我不知
  • 使用正则表达式查找并替换(批处理.BAT)

    我想在多个文本文件中进行查找 替换 如何使用 BAT 实现自动化 我还需要正则表达式 示例 查找
  • 限制 django 应用程序模型中的单个记录?

    我想使用模型来保存 django 应用程序的系统设置 因此 我想限制该模型 使其只能有一条记录 极限怎么办 尝试这个 class MyModel models Model onefield models CharField The fiel
  • 在Python中按属性获取对象列表中的索引

    我有具有属性 id 的对象列表 我想找到具有特定 id 的对象的索引 我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
  • 如何读取Python字节码?

    我很难理解 Python 的字节码及其dis module import dis def func x 1 dis dis func 上述代码在解释器中输入时会产生以下输出 0 LOAD CONST 1 1 3 STORE FAST 0 x
  • Elastic Beanstalk 中的 enum34 问题

    我正在尝试在 Elastic Beanstalk 中设置 django 环境 当我尝试通过requirements txt 文件安装时 我遇到了python3 6 问题 File opt python run venv bin pip li
  • 从 Twitter API 2.0 获取 user.fields 时出现问题

    我想从 Twitter API 2 0 端点加载推文 并尝试获取标准字段 作者 文本 和一些扩展字段 尤其是 用户 字段 端点和参数的定义工作没有错误 在生成的 json 中 我只找到标准字段 但没有找到所需的 user fields 用户
  • 您可以使用关键字参数而不提供默认值吗?

    我习惯于在 Python 中使用这样的函数 方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default

随机推荐

  • 学习一种 Lisp 有助于学习另一种 Lisp 吗?

    学习不同的 Lisp 语言之间有协同作用吗 我目前正在学习 Emacs Lisp 因为它在我的日常 Emacs 使用中立即有用 但是我对所有 Lisp 都很着迷 所以也许有一天我会学习和使用其他语言 当我开始深入研究 Common Lisp
  • 组合 Spark Dataframe 中链接在一起的行

    我有一个数据框 其行通过各种合并相互连接 到目前为止 我已经将 DF 转换为下面的格式 我在其中执行了 groupBy Merge To 并将它们收集到一个数组中 然后将其连接回我的原始 DF 看起来像这样 df1 Ref Merge To
  • Android IAB:“刷新库存时出错(查询商品价格)”开发者错误

    我一直在应用程序计费 v3 中设置 Android 使用IABHelper类 并遵循示例代码 http developer android com training in app billing index html由谷歌提供 我在购买过程
  • .NET TimeZone.CurrentTimeZone.GetDaylightChanges 返回错误的 2005 年 DST

    我使用以下代码显示 2005 年至 2035 年之间的夏令时 2005 年 这page http www timeanddate com time dst 2005 html显示 DST 为 4 月 3 日至 10 月 30 日之间 但 G
  • iOS 7,使用默认的 InteractivePopGestureRecognizer 快速向后滑动时损坏 UINavigationBar

    我有一个问题一直困扰着 但我不知道为什么会发生 如果我将细节控制器推入堆栈 然后使用默认左边缘快速向后滑动interactivePopGestureRecognizer 我的父 根视图控制器的UINavigationBar看起来损坏了或者什
  • Android 视频多次播放后停止播放错误 1、2147483648

    好吧 这有点令人沮丧 我已经搜索了 Stack 但似乎没有一个答案有帮助 我有一个 Android 应用程序 可以循环显示屏幕上的不同内容 在某一时刻 它会播放一个视频 同一个视频 从同一个位置加载 经过随机次数的播放后 它决定停止播放视频
  • MPMoviePlayerController - 加载电影时捕获网络错误

    有没有办法捕获异常 特别是网络错误 没有可用的连接 当使用 MPMoviePlayerController 时 我特别担心一旦播放器的实例被初始化initWithURL 您无法知道电影加载是否由于某种原因失败 我已经查看了可用的文档并意识到
  • SwiftUI LazyHGrid 动态行之间的空间

    您能否建议如何在网格中拥有动态的行数 我有 5 个单词 这些单词的宽度可能不同 这个想法是让它们彼此相邻显示 如果没有足够的空间 gt 移动到下一行 我目前正在使用这个 var rows GridItem init adaptive min
  • 为什么 JavaScript 的 getElementsByClassName 提供一个不是数组的对象?

    我正在尝试使用 JavaScript 不使用 jQuery 获取页面上具有特定类名的所有元素的列表 因此 我使用 getElementsByClassName 函数 如下所示 var expand buttons document getE
  • 使用 clang API 打印参数的类型 (ParmVarDecl)

    我需要使用 clang API 打印 C 源文件中参数的类型 如果我有 clang 中的参数表示 ParmVarDecl param 我可以使用打印参数的名称param gt getNameAsString 我需要一个方法param gt
  • 如何向 boto (Amazon S3) 中的密钥添加标签?

    我正在尝试标记已上传到 S3 的密钥 在下面的内容中 我只是从字符串创建一个文件 一旦我有了密钥 我不知道如何标记文件 我尝试过 Tag 和 TagSet from boto s3 bucket import Bucket from bot
  • PHP 将所有对象属性复制到此

    我有一个 PHP 类型的对象MyObject myObject instanceof MyObject 现在 在class MyObject 有一个非静态函数 在那里 我使用对 我 的引用 例如 this 但我那里还有另一个对象 是否有可能
  • 使用 mod_rewrite 进行语言重定向

    我有一个提供 7 种语言版本的网站 我希望仅当用户访问主页时才能根据浏览器语言重定向用户 这是为了增加有机流量的可用性 我需要此重定向仅适用于主页 因为该网站还会发送特定于每种语言的邮件 如果用户被重定向 它们将不起作用 此外 每种语言都是
  • 如何让长按电源键拒绝关机?

    在大多数较新的计算机上 您可以通过按住电源按钮几秒钟来硬关闭 但我想完全阻止这种情况发生 您可以阻止一些软事件 例如 Windows 控制面板中的睡眠 挂起 休眠和 按电源按钮 事件 您还可以使用一些 Win32 和 WDI 编程来捕获和处
  • __init__() 得到意外的关键字参数 'y'

    我正在阅读 绝对初学者的 Python 编程 一书 并决定通过制作自己的游戏来测试我的一些技能 这个游戏基本上是 不要被飞行的尖刺击中 我遇到了一个问题 使用此代码运行时 class Player games Sprite The play
  • Manifest 文件的用途是什么

    https docs oracle com javase tutorial deployment jar manifestindex html https docs oracle com javase tutorial deployment
  • 枚举所有打开的连接

    是否可以使用 NET枚举当前进程的所有打开的连接 与 netstat 工具执行此操作的方式类似 您可以使用IPGlobalProperties http msdn microsoft com en us library system net
  • 验证 React Native 中的 Style 属性类型

    我有一个组件 它的属性包含子组件的西林 我想确保propTypes正确验证它的类型 我可以从 React Native 代码中得知它有一个ViewStylePropTypes https github com facebook react
  • 如何将 DLL 链接到我的项目?错误 LNK2019:无法解析的外部符号

    我有一个文件foo h有各种函数声明 所有这些功能都在一个文件中实现foo dll 但是 当我包含 h 文件并尝试使用任何函数时 我收到错误 bar obj error LNK2019 unresolved external symbol
  • 替换单词和字符串 pandas

    dataframe pd DataFrame Date This 1A1619 person BL171111 the A 1 24 dont Z112 but NOT 1 22 2001 mix 1A25629Q88 or A13B ok