我使用以下命令读取了一个在其字段中包含 html 代码的 csv 文件fread
,对其进行一些维护并将生成的数据表写入文件中fwrite
。问题是现在所有的 html 都充满了四重引号,例如colspan="""""7""""
。有的是qmethod
参数,但我不确定如何使用它,因为我也不感兴趣用反斜杠转义引号。
是否可以避免这种情况,或者我必须使用 sed ?
例如我得到了 csv 文件:
htmlcode,id
<colspan="7">,1
<colspan="8">,2
我将其读入数据表中fread
,我删除 id 列并将数据表写回到 csv 文件中fwrite
I get:
htmlcode
<colspan=""""7"""">
<colspan=""""8"""">
两种可能的解决方案(使用v1.10.0 of 数据表):
1:使用quote = FALSE
范围:
fwrite(dt, 'fwrite.csv', quote = FALSE)
在文本编辑器中打开文件时,您将看到以下内容:
htmlcode
<colspan="7">
<colspan="8">
2:将双括号替换为单括号(@joel.wilson 在评论中也建议):
dt[, htmlcode := gsub('\"', '\'', htmlcode)]
fwrite(dt, 'fwrite.csv')
在文本编辑器中打开文件时,您将看到以下内容:
htmlcode
<colspan='7'>
<colspan='8'>
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)