R 未检测到字符串中的 \x 模式

2024-01-10

有人知道如何检测并替换“\x”吗R?

library(stringr)
x <- "gesh\xfc"
str_detect(x, "\\x")
# Error in stri_detect_regex(string, pattern, negate = negate, opts_regex = opts(pattern)) : 
# Unrecognized backslash escape sequence in pattern. (U_REGEX_BAD_ESCAPE_SEQUENCE)

nchar(x)
# Error in nchar(x) : invalid multibyte string, element 1

iconv(x, "latin1", "utf-8")
# [1] "geshü"
Encoding(x)
# [1] "unknown"

会议信息:

> sessionInfo()
R version 3.6.0 (2019-04-26)
Platform: x86_64-apple-darwin15.6.0 (64-bit)
Running under: macOS High Sierra 10.13.6

...

locale:
[1] fr_CH.UTF-8/fr_CH.UTF-8/fr_CH.UTF-8/C/fr_CH.UTF-8/fr_CH.UTF-8

上下文:我读取了一个 .csv 文件data.table::fread()但该文件的名称为德语,带有 ä、ö、ü 等字母。一旦在 R 中读取,这些字母就会变成以"\x"。此后在 R 中就无法使用了。


只是总结一下这里发生的事情。 “\x”不是字符串的一部分。这就是 R 转义它无法打印的值的方式。对于“gesh\xfc”,前 4 个字符是基本 ASCII 字符,但最后一个字符被编码为“\xfc”。在 latin1 编码(Windows 默认使用)中fc字符是“ü”字符。所以在我的 Windows 机器上,我看到

x <- "gesh\xfc"
x
# [1] "geshü"

您可以使用以下命令查看该字符串的原始字节

charToRaw("gesh\xfc")
# [1] 67 65 73 68 fc

您可以看到前 4 个值的 ASCII 十六进制字符代码,然后您可以看到\x实际上只是用于在字符串中包含“fc”字符代码。字符串本身只有 5 个“字符”。

但如果你不使用latin1,“fc”字符不映射到任何内容。基本上,该字符串在 Mac 默认使用的 utf-8 编码中没有任何意义。您可以使用以下命令转换为 utf-8

iconv("gesh\xfc", "latin1", "utf-8")

但由于您通过导入文本文件获得了该文件,因此问题是 R 不知道该文件的编码不是 UTF-8,因此您最终会得到这些奇怪的值。你应该告诉fread该文件来自 Windows,因此它可以从一开始就正确导入字符串

fread(file, encoding = "Latin-1")

您需要知道使用什么编码来制作要导入的文件,尤其是由其他人制作的文件。程序实际上不可能正确猜测。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R 未检测到字符串中的 \x 模式 的相关文章

  • 多个变量的分组描述性统计

    给定数据框 df Hup Hop testA testB Y Hi 1 1 N Lo 2 2 Y Mi 3 3 N No 4 4 Y Hi 5 5 N Lo 6 6 Y Mi 7 7 N No 8 8 Y Hi 9 9 N Lo 10 10
  • 将多个对齐的绘图放置在一页上时避免浪费空间

    我想将四个图放在一个页面上 轴标签应仅打印在最边缘 即x仅用于底部图表的轴标签 以及y仅左图的轴标签 这既适用于整个轴的名称 也适用于各个刻度线 我可以使用以下代码生成一些内容 pdf file ExampleOutput pdf widt
  • xts 函数不将我的 POSIXct 日期视为适当的基于时间的对象

    我创建了一个包含两列的数据框 gt head data frame Date Rainfall 1 1992 01 06 14 00 00 0 3 2 1992 01 06 15 00 00 0 2 3 1992 01 06 16 00 0
  • R 因子变量之间的相关性

    我想知道是否有一种简单的方法来识别与另一个变量 100 相关的特征 因子变量 因此 在示例中 该过程将匹配 颜色 和 车辆 以及 植物 和 高度 color lt c black black blue blue yellow vehicle
  • 在字符串中每个字母后面添加数字

    我有几个具有固定格式的字符串 格式为一个字母后跟一个数字 例如 A3B1C7D1 但是 如果字母后面的数字为 1 则字符串将写为 A3BC7D 我想做的是插入数字 1 然后将字符串转换为A3BC7D to A3B1C7D1 我的示例数据是
  • 重用 R 中内置的模型

    在 R 中构建模型时 如何保存模型规范以便可以在新数据上重用它 假设我根据历史数据建立逻辑回归 但直到下个月才会有新的观察结果 最好的方法是什么 我考虑过的事情 保存模型对象并在新会话中加载 我知道某些模型可以使用 PMML 导出 但还没有
  • Foreach循环无法找到对象

    我正在尝试将 foreach 与并行后端结合使用来加速计算 用于特征选择的 AUCRF 随机森林的交叉验证 如果这确实重要的话 在这样做的过程中 我需要获取向量的子集 向量的名称可以更改 但可以作为字符向量进行访问 我使用 eval par
  • R 控制台是我的母语,如何将 R 设置为英语?

    我在 Windows 7 上使用 R 显然 R 不知何故发现了我说英语以外的语言的证据 并且顽固地坚持在控制台中以我自己的语言提供输出 由于多种原因 这是不可取的 我希望 R 是英语 什么有效 我能够使用LANGUAGE en作为 R 控制
  • 在 ggplot2 中,如何将堆叠直方图中的小值条形组合在一起?

    示例数据 tmp df lt data frame a rnorm 100 0 1 b rnorm 100 0 5 1 c rnorm 100 0 5 1 d rnorm 100 1 1 e rnorm 100 1 1 gt tidyr g
  • rmarkdown 中的内部链接不起作用

    我使用 rmarkdown 来渲染 pdf 文档 现在我想在文本中添加内部链接 在帮助页面中降价 http rmarkdown rstudio com authoring pandoc markdown html links 它说内部链接定
  • R闪亮的html小部件之间的交互

    我正在开发一个 R 闪亮应用程序 它使用多个 html 小部件 特别是网络D3 d3热图 and 和弦诊断 这些小部件单独工作正常 但是 在同一页面中使用它们会留下一个空格处他们应该在哪里 这是显示错误的可重现代码 在 UI 中注释绘图线
  • R:变换不规则时间字符串

    我有两个不同的时间序列 来自不同的数据帧 具有不同的不规则格式 但问题是相同的 我只想提取小时 分钟 秒和毫秒 时代系列看起来像这样 ts1 08 27 23 445 08 27 24 280 08 27 25 115 I tried st
  • Shiny 中的模态对话框:可以调整宽度但不能调整高度

    在我的 Shiny 应用程序中 我有几个来自闪亮BS 包的模式窗口 我可以像这样调整这些模式窗口的宽度 tags head tags style HTML modal lg width 1200px abs 1 background col
  • 单击并按住 R 中的按钮闪亮?

    我希望能够通过单击 R 闪亮按钮来更改参数的值 所以我需要按钮 一个用于增加值 一个用于减少值 我想在按住按钮的同时保持值以一定的速度减少 增加 通过释放按钮的点击 动作应该停止 到目前为止我还没有找到这个选项actionButtons在
  • R 中大型稀疏矩阵的聚类分析

    我有一个包含 250000 笔交易 行 和 2183 项 列 的交易数据集 我想将其转换为稀疏矩阵 然后对其进行分层聚类 我尝试了包 sparcl 但它似乎不适用于稀疏矩阵 关于如何解决这个问题有什么建议吗 或者我可以使用任何其他包对稀疏矩
  • R 中 write.table 文件名中的变量

    请帮助我解决一个幼稚的问题 已经用谷歌搜索 并尝试了很多变体 但失败了 如何使用 R 中 write table 的文件名中的变量保存文件 脚本循环遍历 dir 中的文件 应用一些函数 然后将结果保存到具有相同名称但附加结尾的文件中 谢谢
  • 将文本添加到 ggplot 中的轴标签

    我从下表中绘制了一个图表 BoatPhs fit se lower upper 1 Before 3 685875 0 3287521 3 038621 4 333130 2 After0 20NTA 3 317189 0 6254079
  • 使用 ggplotly(ggplot2 withplotly)时可以去掉注释中的跟踪标签吗?

    使用ggplotly时是否可以删除注释中的跟踪标签 例如 library ggplot2 library plotly g lt ggplot iris aes Sepal Width Sepal Length geom point ann
  • mclapply 用户时间大于已用时间

    我正在尝试使用mclapply的功能parallel封装在R 该函数通过计算对数似然距离将值分配给序列矩阵 这是一个 CPU 密集型操作 所结果的system time价值观令人困惑 gt system time mclapply work
  • 如何用日语创建 ggplot2 标题?

    我正在准备日语演示文稿 并希望图像的标题和图例名称为日语 我可以让文本在 RStudio 中渲染得很好 但是当渲染图像时 日语字符仅显示为方框 x 10 10 y x x df data frame x y ggplot df aes x

随机推荐

  • NSTimer改变图像iPhone编程

    如何在iPhone编程中使用NSTimer定期更改图像 我创建一个用于加载图像的图像视图 我想在 imageview 中显示图像并使用 NSTimer 定期更改图像 我不使用 NSTimer 而是使用一组图像并对它们进行动画处理 查看文档从
  • 在cordova android项目中定义有关buildType的包名称

    如何定义关于我的 buildType 的正确包名称 我有这个命令行来构建 cordova run android device buildType beta 我有这个钩子 在准备之后 它从命令行设置 buildType fs appendF
  • 网格图的常见图例[重复]

    这个问题在这里已经有答案了 在这个可重现的示例网格图中 3 个图有 3 种填充颜色 z 显示为蓝色 col 但在第四个图中只有 1 个 col 因此 z 显示为红色 我只想展示一个常见的传说 我可以做到 但我希望 z 在所有四个图中都是蓝色
  • 如何在网站登录完成之前隐藏 WebView? [本机反应]

    我正在尝试制作一个显示网站的组件WebView然后自动填写用户信息进行登录 我通过向其中注入一些 javascript 来处理自动填充部分WebView与injectedJavascipt prop 但问题是我想隐藏WebView 登录页面
  • 在 Haskell 中实现 Iota

    Iota 是一种小得可笑的 编程语言 仅使用一个组合器 我有兴趣了解它是如何工作的 但是以我熟悉的语言查看其实现会很有帮助 我找到了一个用Scheme编写的Iota编程语言的实现 不过 我在将其翻译成 Haskell 时遇到了一些麻烦 它相
  • 错误:onActivityResult 不覆盖任何内容

    我正在用 Kotlin 为 Android 编写一个语音识别应用程序 class MainActivity AppCompatActivity public override fun onCreate savedInstanceState
  • 如何在 Android 7+ 上阻止“按住后退按钮”退出“锁定任务模式”

    我正在尝试使用 锁定任务模式 如上所述https developer android com work cosu html https developer android com work cosu html 我的目标是让单个应用程序在 信
  • Google Script GetRange 与基于列中的值的过滤器并仅选择某些列

    我有一个 35 列和 300 行的数据集 我想要获取仅包含第 30 列 名称 中某些值的行的范围 要过滤数据的名称基于活动报告表中的报告文件单元格 B6 到目前为止我尝试过这个 var report SpreadsheetApp getAc
  • 如何捕获抽屉的打开和关闭抖动?

    如何捕捉抽屉打开和关闭的颤动 原则上 必须使用两个对象来实现此目的 保存 抽屉的 DrawerController 和抽屉回调 抽屉回调应该跟踪抽屉的打开和关闭 但是讨论的代码https github com flutter flutter
  • iOS 中 UITextField 中的密码验证

    我有 1UITextfield我的 iPhone 应用程序中的密码 我想通过以下验证来验证此文本字段 必须至少 10 个字符 必须至少包含 1 个小写字母 1 个大写字母 1 个数字和 1 个特殊字符 有效的特殊字符是 10 d a z A
  • 在react-admin中,如果查询字段的长度很短,如何防止发送get请求

    我正在使用react admin并尝试创建一个带有自动完成字段的过滤器 该过滤器将在我键入时进行查询 并且仅当搜索条件长度长于2时才开始发送查询 我目前正在使用shouldRenderSuggestions在我的里面Autocomplete
  • Matlab:显式指定饼图切片颜色

    我正在创建一个饼图 pie a b c d 是否可以显式更改各个切片的颜色 例如 如果我希望 a 和 b 的切片始终为绿色 c 和 d 的切片始终为蓝色 无论其大小如何 我该怎么做 在我看来 颜色图使用切片的大小进行着色 不一定是提供给饼函
  • JavaFX - 如何更改选定的未聚焦行的 TableView 颜色?

    无论我做什么 该行的颜色保持不变并且呈灰色 这些更改仅在 TableView 获得焦点时才有效 我尝试了在网上找到的所有其他建议 例如另一个线程的解决方案 table row cell selected fx background colo
  • 无法在 VS 2015 中编译 CUDA 代码

    我最近安装了Cuda 8 0工具包 https developer nvidia com cuda downloads在我的 Windows 10 桌面中 删除所有 v7 5 组件后 尽管以前的版本与 Visual Studio 2015
  • Keras 如何计算多类分类问题的验证准确性和训练准确性?

    我想知道 Keras 如何计算多类分类问题的验证和训练精度 即使用的函数 我将模型编译设置如下 model compile optimizer Adam lr 0 001 loss categorical crossentropy metr
  • ListView.ItemContainerStyle IsSelected 属性似乎不影响 WinRT 上的选择

    我试图在问题调试期间将 IsSelected 直接设置为 true 无绑定 最后我尝试使用绑定 但发现即使没有绑定也不起作用 以下代码在 WPF 中运行良好 选择了所有项目 但在 WinRT 上不起作用 执行后未选择任何项目 这是一个错误
  • 如何找到给定 GArray 的长度?

    我有一个 GValue 的 GArray 全部非零 它已在运行时使用 g array append val 进行分配 我想知道如何找出最后一个元素的索引是什么 或者更准确地说数组包含多少个元素 代码如下 for length 0 g val
  • 如何使用 javascript 访问 json 文件 (API) 中的元素?

    我正在尝试显示此 JSON 文件中的所有名称 https next json generator com api json get 41P1 UhSI https next json generator com api json get 4
  • Rust 中是否可以返回借用或拥有的类型?

    在下面的代码中 如何返回floor而不是一个新对象 是否可以让函数返回借用的引用或拥有的值 extern crate num 0 2 0 use num bigint BigInt fn cal a BigInt b BigInt floo
  • R 未检测到字符串中的 \x 模式

    有人知道如何检测并替换 x 吗R library stringr x lt gesh xfc str detect x x Error in stri detect regex string pattern negate negate op