假设我编写一个函数来解析包含德语的输入流。下面是一个玩具示例。以下内容在我的机器上有效(因为 UTF8 是标准):
readLines(textConnection("Zürich"))
readLines(textConnection("Z\u00FCrich")) #same thing
不过我想确保它在以下情况下也能工作UTF-8
不是当前的区域设置编码。例如在 rApache 中,默认是ascii
。因此我传递了编码参数:
readLines(textConnection("Zürich", encoding="UTF-8"))
readLines(textConnection("Z\u00FCrich", encoding="UTF-8"))
但这实际上会导致输出变得混乱。为什么是这样?我该怎么打电话textConnection
确保流在任何平台或区域设置上都能正确读取?
@flodel 的建议确实起到了作用:
readLines(textConnection("Z\u00FCrich", encoding="UTF-8"), encoding="UTF-8")
然而我一直不清楚为什么需要这样做。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)