我必须使用如下所示的 .csv 文件:
"IDEA ID,""IDEA TITLE"",""VOTE VALUE"""
"56144,""Net Present Value PLUS (NPV+)"",1"
"56144,""Net Present Value PLUS (NPV+)"",1"
如果我使用 read.csv,我会获得一个包含一个变量的数据框。我需要的是一个包含三列的数据框,其中各列用逗号分隔。如何处理行首和行尾的引号?
我认为如果不先去掉首引号和结尾引号,就没有一种简单的方法可以做到这一点。如果你有sed
在您的系统上(Unix [Linux/MacOS] 或 Windows+Cygwin?)
read.csv(pipe("sed -e 's/^\"//' -e 's/\"$//' qtest.csv"))
应该管用。否则
read.csv(text=gsub("(^\"|\"$)","",readLines("qtest.csv")))
对于大文件来说效率稍低(您必须在处理之前阅读整个内容),但应该可以在任何地方工作。
(可能有一种方法可以执行正则表达式sed
以与第二个示例使用的括号相同、更紧凑的形式,但我厌倦了尝试整理所有反斜杠都属于哪里.)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)