Python正则表达式提取宽度x深度x高度

2024-04-25

我正在尝试从 df 中的“描述”列中提取项目的物理尺寸,以用它创建一个新列。

尺寸通常以这种格式 (120x80x100) 出现在长描述的中间,例如:

Lorem ipsum dolor sit amet, consectetur adipiscing elit 120x80x100 ed do eiusmod tempor...

但有时之间有空格:

120 x 80 x 100

或者没有身高:

120x80
120 x 80

有什么帮助吗? 提前致谢


您可以使用regex https://regex101.com/r/rS27Vf/1, \d+\s*x\s*\d+(?:\s*x\s*\d+)?

解释:

  • \d+: 一位或多位数字
  • \s*:零个或多个空白字符
  • x:字面意思,x
  • (?:\s*x\s*\d+)?:可选的非捕获组

如果您希望数字为一到三位数,请替换\d+ with \d{1,3}如图所示regex https://regex101.com/r/GjwkRx/1, \d{1,3}\s*x\s*\d{1,3}(?:\s*x\s*\d{1,3})?.

如果您的代码要求您使用组,请按如下方式操作:

(\d{1,3}\s*x\s*\d{1,3}(?:\s*x\s*\d{1,3})?)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python正则表达式提取宽度x深度x高度 的相关文章

随机推荐