我测试了一些可能有帮助的东西。
首先,我保存了空白的 R 脚本并确保它采用 UTF-8 编码:文件 -> 使用编码保存 -> UTF-8。然后仅将问题中的特殊字符用双引号保存为 .csv(即"➕, ♂️, Ñ, áéíóú"
)。然后读取 csvfileEncoding = "UTF-8"
, i.e:
test <- read.csv("test.csv", fileEncoding = "UTF-8", header=FALSE, stringsAsFactors = FALSE)
在 R Studio 内部,test
返回:
# > test
# V1
# 1 \u2795, ♂️, Ñ, áéíóú
因此,除了 ➕ 之外的所有内容都可以在 R Studio 中很好地显示。然而,很多字符,甚至是常见的字符,如换行符和制表符等,在 RStudio 中都会有趣地显示,但通常是在写入文件时显示。这些没有什么不同。
当写入 csv 时(仅使用write.csv(test, 'test2.csv', row.names=FALSE)
),它像在原始 csv 中一样完美显示(即在 sublime text 中打开时)
毕竟,我建议确保您的编码是 UTF-8,也许尝试将 BQ 输出保存为 csv(如果可能的话?)并检查它以查看问题是否来自 BQ 或 R。如果出现BQ 正确,那么只需更改 RStudio 中的编码即可。但如果它没有按预期从 BQ 中出来,那么我建议您需要更改 BQ 中的数据类型(更改为 UTF-8)