在R中打印unicode字符串

2023-12-02

我输入了一个文本字符串.csvfile ，其中包含 unicode 符号，如下所示：\U00B5克/分升。在.csv文件以及在 R 数据帧中读取：

enter image description here

test=read.csv("test.csv")

enter image description here

\U00B5将产生微符号- µ。 R 按原样将其读入数据文件（\U00B5）。但是，当我打印字符串时，它显示为\\U00B5 g/dL.
或者，手动输入代码也可以。

varname <- c("a", "b", "c")
labels <- c("A \U00B5 g/dL", "B \U00B5 g/dL", "C \U00B5 g/dL")
df <- data.frame(varname, labels)
test <- data.frame(varname, labels)
test
#  varname   labels
#  1       a A µ g/dL
#  2       b B µ g/dL
#  3       c C µ g/dL

我想知道如何摆脱逃生标志\在这种情况下，让它打印出符号。或者，是否有另一种方法可以打印 R 中的符号。

非常感谢您的帮助！

好吧，首先要了解 R 中的某些字符如果超出标准 ASCII 字符，则必须进行转义。通常这是通过“\”字符完成的。这就是为什么在 R 中编写字符串时需要转义该字符：

a <- "\" # error
a <- "\\" # ok.

“\U”是 unicode 转义的特殊指示符。请注意，使用此转义时，字符串本身中没有斜杠或 U。它只是特定字符的快捷方式。笔记：

a <- "\U00B5"
cat(a)
# µ
grep("U",a)
# integer(0)
nchar(a)
# [1] 1

这与字符串有很大不同

a <- "\\U00B5"
cat(a)
# \U00B5
grep("U",a)
# [1] 1
nchar(a)
# [1] 6

通常，当您导入文本文件时，您会以文件使用的任何编码对非 ASCII 字符进行编码（UTF-8 或 Latin-1 是最常见的）。它们有特殊的字节来表示这些字符。文本文件具有 unicode 字符的 ASCII 转义序列是不“正常”的。这就是为什么 R 不会尝试将“\U00B5”转换为 unicode 字符，因为它假设如果您想要 unicode 字符，您将直接使用它。

重新解释 ASCII 字符值的最简单方法是使用stringi包裹。例如

library(stringi)
a <- "\\U00B5"
stri_unescape_unicode(gsub("\\U","\\u",a, fixed=TRUE))

（唯一的问题是我们需要将“\U”转换为更常见的“\u”，以便函数正确识别转义）。您可以使用以下命令对导入的数据执行此操作

test$label <- stri_unescape_unicode(gsub("\\U","\\u",test$label, fixed=TRUE))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

Unicode

在R中打印unicode字符串的相关文章

如何在 R 中执行近似（模糊）名称匹配

我有一个专门用于生物学期刊的大型数据集该数据集是由不同的人长时间编写的因此数据不采用单一格式例如在作者栏中我可以找到John Smith Smith John Smith J等但它们是同一个人我连最简单的动作都做不了例如
CharInSet 不适用于非英文字母？

我已经将应用程序从 Delphi 2007 更新到 Delphi 2010 一切都很顺利除了一条编译正常但不起作用的语句 If Edit1 Text 1 in S then ShowMessage Found else ShowMessa
在 RcppArmadillo 中将列向量乘以数值标量

我在编译这个简单的程序时遇到一些麻烦c 代码使用Rcpp和RcppArmadillo包裹采用以下简单示例将矩阵的每一列乘以数值标量 code lt arma mat out Rcpp as
闪亮的应用程序包：css 和所有 www/ 目录内容

我正在尝试将 Shiny 应用程序转换为 R 包但我在处理有关 www 目录以及松散文件的所有问题时遇到了问题我闪亮的应用程序运行得很好但是当我尝试打包它时它不起作用我闪亮的应用程序目录 my shiny app R ut
R - 重塑 - 熔化错误

我正在尝试融化数据框但出现了这个奇怪的错误有什么想法吗 str zx7 data frame 519 obs of 5 variables calday new Date format 2011 01 03 2011 01 04 201
从 data.frame 在 ggplot 图例中添加信息

我想在图例中添加信息哪个传感器具有该值这是我的代码 z lt data frame a c sensor 1 sensor 2 sensor 3 sensor 4 sensor 5 sensor 6 sensor 7 sensor 8
如何按定义的顺序将图像合并到一个文件中

我有大约 100 张图像 png 我不想手动执行此操作而是希望将它们按照定义的顺序基于文件名并排放置在一个 pdf 中每行 12 个图像有人有什么建议吗我按照下面托马斯告诉我的方法尝试了它把它们贴在旁边有一个黑边我怎样才能去
在 RMarkdown 输出到 PDF 时缩进而不添加项目符号点或编号

之前有人问过如何在没有项目符号的情况下缩进文本 RMarkdown 中的点但这是针对 HTML 输出的在 RMarkdown 中缩进而不添加项目符号点或数字 https stackoverflow com questions 47087
为什么这个 R ggplot2 代码会显示一个空白的显示设备？

虽然 SO 通常不用于帮助解决错误但这个显示了特别简单且特别烦人的行为如果你是一个ggplot2用户您可以在 10 秒或更短的时间内重现它正如这个 GitHub 问题 ggplot gtable 创建空白显示 https githu
从数据框中绘制多条平滑线

我对 R 比较陌生我正在尝试绘制从 csv 文件加载的数据框数据由 6 列组成如下所示 xval col1 col2 col3 col4 col5 第一列 xval 由一系列单调递增的正整数例如 10 40 60 等组成其他列
如何在 R 中的 dygraph 标题中使用 UTF-8 字符

使用 Rstudio Windows8 当我使用 dygraph 函数绘制时间序列时在尝试在主标题中使用 UTF 8 字符时遇到问题 library dygraphs dygraph AirPassengers main T tulo 这
扩展数据框以使其具有与原始行中两列的范围一样多的行[重复]

这个问题在这里已经有答案了我有一个数据框如下 structure list symbol c u n v i a start c 9L 6L 10L 8L 7L end c 14L 15L 12L 13L 11L Names c symb
计算 R 行中的非零条目数

我有以下类型的数据 mode1 mode2 mode3 1 8 1 0 2 0 0 0 3 6 5 4 4 1 2 3 5 1 1 1 数据使用dput structure list mode1 c 8L 0L 6L 1L 1L mode2
无法将“gather”输出的列名称更改为默认名称以外的任何名称

我正在尝试使用gather in the tidyr包但我无法更改默认名称的输出列名称例如 df data frame time 1 100 a 1 100 b 101 200 df long df gt gather foo bar
将整个包传递给雪簇

我正在尝试并行化使用snow parLapply 一些依赖于包即除snow 调用函数中引用的对象parLapply必须使用显式传递给集群clusterExport 有没有办法将整个包传递到集群而不必显式命名每个函数包括用户函数调用的
在 RGL 中将立方体绘制到 3D 散点图中

我正在尝试向 3D 散点图添加较小的立方体网格具有指定边长我希望立方体位于原点我该怎么做呢我已经玩过cube3d 但我似乎无法将立方体正确定位也无法使其成为网格因此我可以看到它包含的数据点这是我所拥有的 library rg
R 中的数据框操作 - 将单元格向左移动并删除 NA

我有一个数据框其列由随机分布的值和 NA 组成如下所示 a lt c S E NA S NA b lt c A NA M G K c lt c I NA NA NA L meh lt dataframe a b c 1 2 3 4 5
将 Excel 文件读入 R 并锁定单元格

我有一个 Excel 电子表格要读入 R 它受密码保护并锁定了单元格我可以使用 excel link 导入受密码保护的文件但我不知道如何解锁取消保护单元格 excel link 给了我这个错误 gt
更改绘图区域背景颜色

我想使用我们公司的颜色在 R 中制作一个图表这意味着所有图表的背景应为浅蓝色但绘图区域应为白色我正在寻找答案发现绘制一个矩形就可以完成这项工作几乎然而绘图区域现在是白色的并且图形不再可见这可能吗 getSymbols SP
闪亮井板宽度

library shiny library shinydashboard ui lt dashboardPage dashboardHeader dashboardSidebar dashboardBody wellPanel tags d

随机推荐

JSON.NET 反序列化 - 单个结果与数组

我在尝试确定如何使我的序列化能够正确访问单个结果以及数组时遇到困难当我进行 REST 调用在服务器上查找某些内容时有时它会返回模型数组但如果搜索结果只有一个模型则不会作为错误返回这是当我收到无法反序列化的异常时因为对象属性需要一
char 类型乘以另一个 char

C C 中两个字符相乘的结果是什么类型 unsigned char a 70 unsigned char b 58 cout lt lt a b lt lt endl prints 4060 means no overflow cout l
查找字符串中重复字符的最长子串

这是基础这个代码强制问题我尽量不寻求有关 codeforces 问题的帮助除非我真的真的陷入困境而现在恰好就是这样 Your first mission is to find the password of the Martian d
glCopyTexImage2D 作为 glReadPixels (OpenGL ES) 的替代品

我目前正在使用 OpenGL ES 游戏的屏幕截图glReadPixels 屏幕截图很棒但是调用glReadPixels导致游戏中出现轻微卡顿 glCopyTexImage2D已被建议作为更有效的替代品glReadPixels 如何glC
如何获取QTableView右键索引

下面的代码创建一个带有QTableView看法左键单击onLeftClick函数获取 QModelIndexindex 该 QModelIndex 稍后用于打印左键单击单元格的行号和列号如何获得QModelIndex右键单击的单元格的索
ffmpeg：编辑元数据并自动增加其名称+根据“名称”设置“标题”的值

此 PowerShell 代码分割了一个大的音频文件 sound1 在 5 分钟内将它们保存为sound100 1 mp3 sound1 002 mp3 ffmpeg i file name complete f segment segme
从 Bool 数组返回索引值数组，其中 true

任何人都知道一种从值为 true 的布尔数组返回索引值数组的优雅方法例如 let boolArray true true false true 这应该返回 0 1 3 let boolArray true true false true
带图像的 Foreach 循环

我有一个 80 PNG 图像序列我试图在其中为我的 Windows 应用程序创建动画文件路径是 Assets Star 我试图弄清楚如何为文件夹中的每个图像创建 foreach 循环因此它将图像对象设置为 Image1 然后在计时器经
为什么我的 div 的边距会受到其内部内容/块的影响？

我有以下内容 div p some content p div or div some content div 没有 p some content p div的定位不同看起来 div 内的块内容正在影响 div 的外顶部边距那么di
将 Pandas 数据框放入现有 Excel 工作表

有没有办法将数据框放入现有的 Excel 工作表中我有一个数据框需要将其复制到特定的 Excel 工作表中的特定位置单元格 A2 这样它将镜像粘贴整个数据框从选定的单元格如图所示开始包括下面的单元格这样我就不必一一为特定
哪里可以获得 Eclipse 的 ADT 18？

我的 eclipse 将 ADT 更新为 20 我认为这很糟糕我想恢复到 18 但找不到从哪里下载 In here https dl ssl google com android eclipse 它仅提供版本 20 Thanks 下载此文
使用 CSS，如何创建*粗*超过 1 像素的文本描边轮廓？

下面是我用来制作 1px 文本描边轮廓的代码但是如何使轮廓变粗呢如果我只是将所有 1px 替换为 5px 结果看起来很疯狂 HTML div class element Hello div CSS element color white
如何利用HTTP header XSS漏洞？

假设一个页面只是打印 HTTP referer 标头的值没有转义因此该页面容易受到 XSS 攻击即攻击者可以使用包含类似内容的引用标头来制作 GET 请求但如何才能真正使用它来攻击目标呢攻击者如何使用该特定标头向目标发出特定请求
为类型别名元组添加 Impl (f64, f64)

我有一个自定义类型 Point type Point f64 f64 我想添加两个Point在一起但我收到此错误 error E0368 binary assignment operation cannot be applied to t
后续：从 lme4 中的 VarCorr 对象中提取名称并将其粘贴为列名称

我正在跟进这个很好的答案功能foo下面取Name的列VarCorr fit 输出并使它们成为列名summary rePCA fit call 当我们输入时效果很好fm1 fm2 但我想知道为什么它失败了fm3 有解决办法吗 librar
我有 recyclerview 和 searchview 如何发送有关我搜索的项目的详细信息数据

我有带有 searchview 的 recyclerview 并且在 recyclerview 中选择项目时发送详细数据问题是当我搜索项目并选择它时详细信息数据不会更改总是出现第一个项目的详细信息数据我如何发送有关我搜索的项目的详细数
如何使实体只读？

使用 JPA 使实体只读的正确方法是什么我希望我的数据库表永远不会以编程方式修改我想我明白我应该用以下方式锁定我的对象LockModeType READ 是否可以使用注释使我的实体在从数据库检索后直接锁定或者我是否必须为该特定实体搞乱
在查询结束之前开始查看查询结果

假设我查询一个包含 500K 行的表我想开始查看获取缓冲区中保存结果集的任何行即使查询尚未完成我想滚动浏览提取缓冲区如果我滚动得太远我想显示一条消息例如到达获取缓冲区的最后一行查询尚未完成当查询继续构建结果集时可以使用
类定义如何才能不占用内存呢？

所以我读过this关于类定义是否占用内存以及this关于if函数占用内存这是我不明白的如果函数占用内存或者它们的代码占用内存类定义为什么不占用内存我的意思是类定义也是代码所以它不应该像函数代码一样占用内存吗说类定义不占用内存
在R中打印unicode字符串

我输入了一个文本字符串 csvfile 其中包含 unicode 符号如下所示 U00B5克分升在 csv文件以及在 R 数据帧中读取 test read csv test csv U00B5将产生微符号 R 按原样将其读入数据文件

在R中打印unicode字符串

在R中打印unicode字符串 的相关文章

随机推荐

热门标签

在R中打印unicode字符串的相关文章