我查看了几篇具有类似标题的 Stack Overflow 帖子,但没有一个已接受的答案对我有用。
我有一个 CSV 文件,其中数据的每个“单元格”均由逗号分隔并被引用(包括数字)。每行以换行符结束。
一些文本“单元格”中有引号,我想使用正则表达式来查找它们,以便我可以正确地转义它们。
示例行:
"0","0.23432","234.232342","data here dsfsd hfsdf","3/1/2016",,"etc","E 60"","AD"8"\n
我要匹配只是"
in E 60"
and in AD"8
,但不是其他任何一个"
.
我可以使用什么(最好是 Python 友好的)正则表达式来执行此操作?
编辑:使用@sundance 的正则表达式进行更新,以避免行首和换行符。
您可以尝试仅替换不在逗号、行首或换行符旁边的引号:
import re
newline = re.sub(r'(?<!^)(?<!,)"(?!,|$)', '', line)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)