R 未检测到字符串中的 \x 模式

2024-01-10

有人知道如何检测并替换“\x”吗R?

library(stringr)
x <- "gesh\xfc"
str_detect(x, "\\x")
# Error in stri_detect_regex(string, pattern, negate = negate, opts_regex = opts(pattern)) : 
# Unrecognized backslash escape sequence in pattern. (U_REGEX_BAD_ESCAPE_SEQUENCE)

nchar(x)
# Error in nchar(x) : invalid multibyte string, element 1

iconv(x, "latin1", "utf-8")
# [1] "geshü"
Encoding(x)
# [1] "unknown"

会议信息：

> sessionInfo()
R version 3.6.0 (2019-04-26)
Platform: x86_64-apple-darwin15.6.0 (64-bit)
Running under: macOS High Sierra 10.13.6

...

locale:
[1] fr_CH.UTF-8/fr_CH.UTF-8/fr_CH.UTF-8/C/fr_CH.UTF-8/fr_CH.UTF-8

上下文：我读取了一个 .csv 文件data.table::fread()但该文件的名称为德语，带有 ä、ö、ü 等字母。一旦在 R 中读取，这些字母就会变成以"\x"。此后在 R 中就无法使用了。

只是总结一下这里发生的事情。 “\x”不是字符串的一部分。这就是 R 转义它无法打印的值的方式。对于“gesh\xfc”，前 4 个字符是基本 ASCII 字符，但最后一个字符被编码为“\xfc”。在 latin1 编码（Windows 默认使用）中fc字符是“ü”字符。所以在我的 Windows 机器上，我看到

x <- "gesh\xfc"
x
# [1] "geshü"

您可以使用以下命令查看该字符串的原始字节

charToRaw("gesh\xfc")
# [1] 67 65 73 68 fc

您可以看到前 4 个值的 ASCII 十六进制字符代码，然后您可以看到\x实际上只是用于在字符串中包含“fc”字符代码。字符串本身只有 5 个“字符”。

但如果你不使用latin1，“fc”字符不映射到任何内容。基本上，该字符串在 Mac 默认使用的 utf-8 编码中没有任何意义。您可以使用以下命令转换为 utf-8

iconv("gesh\xfc", "latin1", "utf-8")

但由于您通过导入文本文件获得了该文件，因此问题是 R 不知道该文件的编码不是 UTF-8，因此您最终会得到这些奇怪的值。你应该告诉fread该文件来自 Windows，因此它可以从一开始就正确导入字符串

fread(file, encoding = "Latin-1")

您需要知道使用什么编码来制作要导入的文件，尤其是由其他人制作的文件。程序实际上不可能正确猜测。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

stringr

R 未检测到字符串中的 \x 模式的相关文章

多个变量的分组描述性统计

给定数据框 df Hup Hop testA testB Y Hi 1 1 N Lo 2 2 Y Mi 3 3 N No 4 4 Y Hi 5 5 N Lo 6 6 Y Mi 7 7 N No 8 8 Y Hi 9 9 N Lo 10 10
将多个对齐的绘图放置在一页上时避免浪费空间

我想将四个图放在一个页面上轴标签应仅打印在最边缘即x仅用于底部图表的轴标签以及y仅左图的轴标签这既适用于整个轴的名称也适用于各个刻度线我可以使用以下代码生成一些内容 pdf file ExampleOutput pdf widt
xts 函数不将我的 POSIXct 日期视为适当的基于时间的对象

我创建了一个包含两列的数据框 gt head data frame Date Rainfall 1 1992 01 06 14 00 00 0 3 2 1992 01 06 15 00 00 0 2 3 1992 01 06 16 00 0
R 因子变量之间的相关性

我想知道是否有一种简单的方法来识别与另一个变量 100 相关的特征因子变量因此在示例中该过程将匹配颜色和车辆以及植物和高度 color lt c black black blue blue yellow vehicle
在字符串中每个字母后面添加数字

我有几个具有固定格式的字符串格式为一个字母后跟一个数字例如 A3B1C7D1 但是如果字母后面的数字为 1 则字符串将写为 A3BC7D 我想做的是插入数字 1 然后将字符串转换为A3BC7D to A3B1C7D1 我的示例数据是
重用 R 中内置的模型

在 R 中构建模型时如何保存模型规范以便可以在新数据上重用它假设我根据历史数据建立逻辑回归但直到下个月才会有新的观察结果最好的方法是什么我考虑过的事情保存模型对象并在新会话中加载我知道某些模型可以使用 PMML 导出但还没有
Foreach循环无法找到对象

我正在尝试将 foreach 与并行后端结合使用来加速计算用于特征选择的 AUCRF 随机森林的交叉验证如果这确实重要的话在这样做的过程中我需要获取向量的子集向量的名称可以更改但可以作为字符向量进行访问我使用 eval par
R 控制台是我的母语，如何将 R 设置为英语？

我在 Windows 7 上使用 R 显然 R 不知何故发现了我说英语以外的语言的证据并且顽固地坚持在控制台中以我自己的语言提供输出由于多种原因这是不可取的我希望 R 是英语什么有效我能够使用LANGUAGE en作为 R 控制
在 ggplot2 中，如何将堆叠直方图中的小值条形组合在一起？

示例数据 tmp df lt data frame a rnorm 100 0 1 b rnorm 100 0 5 1 c rnorm 100 0 5 1 d rnorm 100 1 1 e rnorm 100 1 1 gt tidyr g
rmarkdown 中的内部链接不起作用

我使用 rmarkdown 来渲染 pdf 文档现在我想在文本中添加内部链接在帮助页面中降价 http rmarkdown rstudio com authoring pandoc markdown html links 它说内部链接定
R闪亮的html小部件之间的交互

我正在开发一个 R 闪亮应用程序它使用多个 html 小部件特别是网络D3 d3热图 and 和弦诊断这些小部件单独工作正常但是在同一页面中使用它们会留下一个空格处他们应该在哪里这是显示错误的可重现代码在 UI 中注释绘图线
R：变换不规则时间字符串

我有两个不同的时间序列来自不同的数据帧具有不同的不规则格式但问题是相同的我只想提取小时分钟秒和毫秒时代系列看起来像这样 ts1 08 27 23 445 08 27 24 280 08 27 25 115 I tried st
Shiny 中的模态对话框：可以调整宽度但不能调整高度

在我的 Shiny 应用程序中我有几个来自闪亮BS 包的模式窗口我可以像这样调整这些模式窗口的宽度 tags head tags style HTML modal lg width 1200px abs 1 background col
单击并按住 R 中的按钮闪亮？

我希望能够通过单击 R 闪亮按钮来更改参数的值所以我需要按钮一个用于增加值一个用于减少值我想在按住按钮的同时保持值以一定的速度减少增加通过释放按钮的点击动作应该停止到目前为止我还没有找到这个选项actionButtons在
R 中大型稀疏矩阵的聚类分析

我有一个包含 250000 笔交易行和 2183 项列的交易数据集我想将其转换为稀疏矩阵然后对其进行分层聚类我尝试了包 sparcl 但它似乎不适用于稀疏矩阵关于如何解决这个问题有什么建议吗或者我可以使用任何其他包对稀疏矩
R 中 write.table 文件名中的变量

请帮助我解决一个幼稚的问题已经用谷歌搜索并尝试了很多变体但失败了如何使用 R 中 write table 的文件名中的变量保存文件脚本循环遍历 dir 中的文件应用一些函数然后将结果保存到具有相同名称但附加结尾的文件中谢谢
将文本添加到 ggplot 中的轴标签

我从下表中绘制了一个图表 BoatPhs fit se lower upper 1 Before 3 685875 0 3287521 3 038621 4 333130 2 After0 20NTA 3 317189 0 6254079
使用 ggplotly（ggplot2 withplotly）时可以去掉注释中的跟踪标签吗？

使用ggplotly时是否可以删除注释中的跟踪标签例如 library ggplot2 library plotly g lt ggplot iris aes Sepal Width Sepal Length geom point ann
mclapply 用户时间大于已用时间

我正在尝试使用mclapply的功能parallel封装在R 该函数通过计算对数似然距离将值分配给序列矩阵这是一个 CPU 密集型操作所结果的system time价值观令人困惑 gt system time mclapply work
如何用日语创建 ggplot2 标题？

我正在准备日语演示文稿并希望图像的标题和图例名称为日语我可以让文本在 RStudio 中渲染得很好但是当渲染图像时日语字符仅显示为方框 x 10 10 y x x df data frame x y ggplot df aes x

随机推荐

NSTimer改变图像iPhone编程

如何在iPhone编程中使用NSTimer定期更改图像我创建一个用于加载图像的图像视图我想在 imageview 中显示图像并使用 NSTimer 定期更改图像我不使用 NSTimer 而是使用一组图像并对它们进行动画处理查看文档从
在cordova android项目中定义有关buildType的包名称

如何定义关于我的 buildType 的正确包名称我有这个命令行来构建 cordova run android device buildType beta 我有这个钩子在准备之后它从命令行设置 buildType fs appendF
网格图的常见图例[重复]

这个问题在这里已经有答案了在这个可重现的示例网格图中 3 个图有 3 种填充颜色 z 显示为蓝色 col 但在第四个图中只有 1 个 col 因此 z 显示为红色我只想展示一个常见的传说我可以做到但我希望 z 在所有四个图中都是蓝色
如何在网站登录完成之前隐藏 WebView？ [本机反应]

我正在尝试制作一个显示网站的组件WebView然后自动填写用户信息进行登录我通过向其中注入一些 javascript 来处理自动填充部分WebView与injectedJavascipt prop 但问题是我想隐藏WebView 登录页面
在 Haskell 中实现 Iota

Iota 是一种小得可笑的编程语言仅使用一个组合器我有兴趣了解它是如何工作的但是以我熟悉的语言查看其实现会很有帮助我找到了一个用Scheme编写的Iota编程语言的实现不过我在将其翻译成 Haskell 时遇到了一些麻烦它相
错误：onActivityResult 不覆盖任何内容

我正在用 Kotlin 为 Android 编写一个语音识别应用程序 class MainActivity AppCompatActivity public override fun onCreate savedInstanceState
如何在 Android 7+ 上阻止“按住后退按钮”退出“锁定任务模式”

我正在尝试使用锁定任务模式如上所述https developer android com work cosu html https developer android com work cosu html 我的目标是让单个应用程序在信
Google Script GetRange 与基于列中的值的过滤器并仅选择某些列

我有一个 35 列和 300 行的数据集我想要获取仅包含第 30 列名称中某些值的行的范围要过滤数据的名称基于活动报告表中的报告文件单元格 B6 到目前为止我尝试过这个 var report SpreadsheetApp getAc
如何捕获抽屉的打开和关闭抖动？

如何捕捉抽屉打开和关闭的颤动原则上必须使用两个对象来实现此目的保存抽屉的 DrawerController 和抽屉回调抽屉回调应该跟踪抽屉的打开和关闭但是讨论的代码https github com flutter flutter
iOS 中 UITextField 中的密码验证

我有 1UITextfield我的 iPhone 应用程序中的密码我想通过以下验证来验证此文本字段必须至少 10 个字符必须至少包含 1 个小写字母 1 个大写字母 1 个数字和 1 个特殊字符有效的特殊字符是 10 d a z A
在react-admin中，如果查询字段的长度很短，如何防止发送get请求

我正在使用react admin并尝试创建一个带有自动完成字段的过滤器该过滤器将在我键入时进行查询并且仅当搜索条件长度长于2时才开始发送查询我目前正在使用shouldRenderSuggestions在我的里面Autocomplete
Matlab：显式指定饼图切片颜色

我正在创建一个饼图 pie a b c d 是否可以显式更改各个切片的颜色例如如果我希望 a 和 b 的切片始终为绿色 c 和 d 的切片始终为蓝色无论其大小如何我该怎么做在我看来颜色图使用切片的大小进行着色不一定是提供给饼函
JavaFX - 如何更改选定的未聚焦行的 TableView 颜色？

无论我做什么该行的颜色保持不变并且呈灰色这些更改仅在 TableView 获得焦点时才有效我尝试了在网上找到的所有其他建议例如另一个线程的解决方案 table row cell selected fx background colo
无法在 VS 2015 中编译 CUDA 代码

我最近安装了Cuda 8 0工具包 https developer nvidia com cuda downloads在我的 Windows 10 桌面中删除所有 v7 5 组件后尽管以前的版本与 Visual Studio 2015
Keras 如何计算多类分类问题的验证准确性和训练准确性？

我想知道 Keras 如何计算多类分类问题的验证和训练精度即使用的函数我将模型编译设置如下 model compile optimizer Adam lr 0 001 loss categorical crossentropy metr
ListView.ItemContainerStyle IsSelected 属性似乎不影响 WinRT 上的选择

我试图在问题调试期间将 IsSelected 直接设置为 true 无绑定最后我尝试使用绑定但发现即使没有绑定也不起作用以下代码在 WPF 中运行良好选择了所有项目但在 WinRT 上不起作用执行后未选择任何项目这是一个错误
如何找到给定 GArray 的长度？

我有一个 GValue 的 GArray 全部非零它已在运行时使用 g array append val 进行分配我想知道如何找出最后一个元素的索引是什么或者更准确地说数组包含多少个元素代码如下 for length 0 g val
如何使用 javascript 访问 json 文件 (API) 中的元素？

我正在尝试显示此 JSON 文件中的所有名称 https next json generator com api json get 41P1 UhSI https next json generator com api json get 4
Rust 中是否可以返回借用或拥有的类型？

在下面的代码中如何返回floor而不是一个新对象是否可以让函数返回借用的引用或拥有的值 extern crate num 0 2 0 use num bigint BigInt fn cal a BigInt b BigInt floo
R 未检测到字符串中的 \x 模式

有人知道如何检测并替换 x 吗R library stringr x lt gesh xfc str detect x x Error in stri detect regex string pattern negate negate op

R 未检测到字符串中的 \x 模式

R 未检测到字符串中的 \x 模式 的相关文章

随机推荐

热门标签

R 未检测到字符串中的 \x 模式的相关文章