我正在尝试从 df 中的“描述”列中提取项目的物理尺寸,以用它创建一个新列。
尺寸通常以这种格式 (120x80x100) 出现在长描述的中间,例如:
Lorem ipsum dolor sit amet, consectetur adipiscing elit 120x80x100 ed do eiusmod tempor...
但有时之间有空格:
120 x 80 x 100
或者没有身高:
120x80
120 x 80
有什么帮助吗?
提前致谢
您可以使用regex https://regex101.com/r/rS27Vf/1, \d+\s*x\s*\d+(?:\s*x\s*\d+)?
解释:
-
\d+
: 一位或多位数字
-
\s*
:零个或多个空白字符
-
x
:字面意思,x
-
(?:\s*x\s*\d+)?
:可选的非捕获组
如果您希望数字为一到三位数,请替换\d+
with \d{1,3}
如图所示regex https://regex101.com/r/GjwkRx/1, \d{1,3}\s*x\s*\d{1,3}(?:\s*x\s*\d{1,3})?
.
如果您的代码要求您使用组,请按如下方式操作:
(\d{1,3}\s*x\s*\d{1,3}(?:\s*x\s*\d{1,3})?)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)