在 Ruby 中将转义的 unicode (\u008E) 转换为重音字符 (Ž)？

2023-12-31

我对此感到非常困难：

# contained within:
"MA\u008EEIKIAI"

# should be
"MAŽEIKIAI"

# nature of string
$ p string3
"MA\u008EEIKIAI" 

$ puts string3
MAEIKIAI

$ string3.inspect
"\"MA\\u008EEIKIAI\""

$ string3.bytes
#<Enumerator: "MA\u008EEIKIAI":bytes>

关于从哪里开始有什么想法吗？

注意：这是not我的副本上一个问题 https://stackoverflow.com/questions/17042608/convert-unicode-mess-to-correct-characters-in-ruby.

\u008E表示带有代码点的 unicode 字符8e（十六进制）出现在字符串中的该点。该字符是控制字符“SINGLE SHIFT TWO”（参见代码表（pdf） http://www.unicode.org/charts/PDF/U0080.pdf）。人物Ž位于代码点u017d。然而它处于位置8e in the Windows CP-1252 https://en.wikipedia.org/wiki/Windows-1252编码。不知何故，你的编码混淆了。

“修复”此问题的最简单方法可能只是打开包含字符串（或数据库记录或其他内容）的文件并将其编辑为正确的。真正的解决方案将取决于有问题的字符串来自哪里以及有多少坏字符串。

假设字符串位于UTF-8编码 http://en.wikipedia.org/wiki/UTF-8, \u008E将由两个字节组成c2 and 8e。注意第二个字节，8e，与编码相同Ž在 CP-1252 中。转换字符串的方法如下：

string3.force_encoding('BINARY') # treat the string just as bytes for now
string3.gsub!(/\xC2/n, '')       # remove the C2 byte
string3.force_encoding('CP1252') # give the string the correct encoding
string3.encode('UTF-8')          # convert to the desired encoding

请注意，这并不是解决所有此类问题的通用解决方案。并非所有 CP-1252 字符在以这种方式以 UTF-8 进行损坏和表达时都适合这样的转换。有些会是两个字节c2 xx where xx正确的字节（就像在这种情况下），其他的将是c3 yy where yy是一个不同的字节。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ruby

encoding

在 Ruby 中将转义的 unicode (\u008E) 转换为重音字符 (Ž)？的相关文章

拆分字符串以仅获取前 5 个字符

我想去那个地点 var log src ap kernelmodule 10 001 100 但看起来我的代码必须处理 ap kernelmodule 10 002 100 ap kernelmodule 10 003 101 等我想使用
Rails 3 在 Ruby 1.9.2 上初始化非常慢

我使用 RVM 来管理环境安装了 Ruby 1 9 2 p136 我认为是最新版本和 Rails 3 创建了 gemset 并运行捆绑器到目前为止一切正常但 Rails 在运行命令即生成销毁 rake 等时初始化速度非常慢完
定义Python源代码编码的正确方法

PEP 263 http www python org dev peps pep 0263 定义如何声明Python源代码编码通常 Python 文件的前两行应以以下内容开头 usr bin python coding
使用 VCR 过滤敏感数据

我正在使用 VCR gem 记录 http 交互并在将来重播它们我想过滤掉 uri 请求中的实际密码值以下是 uri 的示例 http services somesite com Services asmx Cabins Usernam
如何从 ruby 中的字符串中删除所有非数字？

用户输入数字的形式如下 1 800 432 4567 800 432 4567 800 432 4566 800 432 4567 1 800 432 4567 800 432 4567 我希望所有这些都变成没有特殊字符的剥离版本例如18
Rails - 渲染：目标锚标记的操作？

我希望像这样使用渲染 render action gt page form 我也尝试过这个 render template gt site page form 那也没用这个特定页面上的表单位于最底部如果提交时发生任何错误我不希望用户被
Bundle 说 gem 丢失了 - 但事实并非如此？

背景我正在维护contentRuby On Rails 站点但我确实没有 Rails 的经验当尝试运行 Rails 服务器时 rails s我明白了在任何来源中均找不到 activesupport 3 2 0 Run bundle
用户未定义的方法 attr_accessible 错误

我正在尝试创建某种登录我创建了一个用户脚手架并将此代码放在我的 user rb 中 class User lt ActiveRecord Base attr accessible name password digest password
Ruby require 'file' 不起作用，但 require './file' 可以。为什么？

我有一个充满 ruby 文件的文件夹当我尝试使用位于同一目录中的另一个文件中的一个文件时require file 我得到一个LoadError但是当我使用require file 一切正常有人可以向我解释为什么会发生这种情况吗如果有什
RoR - Rails 中的大文件上传

我有一个 Rails Web 应用程序允许用户上传视频视频存储在 NFS 安装的目录中当前的设置适用于较小的文件但我也需要支持大文件上传最多 4GB 当我尝试上传 4GB 文件时它最终会发生但从用户体验的角度来看很糟糕上传开
如何从 Ruby 中的特定相对路径加载文件？

我正在制作一颗供内部使用的宝石在其中我从另一个目录加载一些 YAML in
使用哈希参数进行 DRY Ruby 初始化

我发现自己经常在构造函数中使用哈希参数尤其是在为配置或最终用户将接触到的其他 API 编写 DSL 时我最终做的是类似以下的事情 class Example PROPERTIES name age PROPERTIES each p a
在 Sinatra 中运行后台进程

我有 Sinatra Rails 应用程序和一个启动一些漫长过程的操作通常我会为后台作业排队但这种情况太简单了后台进程很少启动所以队列是一个开销那么如何在没有队列的情况下运行后台进程呢 get build logs project
Ruby 中的 url_encode

I read 的文档url encode http rdoc info stdlib erb 1 9 3 ERB Util 3Aurl encode 是否有一个表可以准确地告诉我哪个字符被编码为什么使用url encode ERB s u
我可以让这个 Ruby 代码更快并且/或使用更少的内存吗？

我有一个Array of StringRuby 中的对象由如下单词组成 animals cat horse dog cat dog bird dog sheep chicken cow 我想将其转换为另一个Array of String对象
ruby on Rails：音频/mp3 内容标题下载

如何在 ruby rails 中设置下载标题在 php 中我为 mp3 下载设置标头如下所示 header Content Transfer Encoding binary header Content type audio mp3
子文件夹和关系中的 Rails 模型

我在自动加载的文件夹中组织了一些轨道模型 config autoload paths Dir Rails root join app models 我可以直接使用所有模型例如Image first file name 但是当我尝试通过关系
嵌套 has_one 关联的强参数

我似乎遗漏了一些明显的东西但我无法允许嵌套的属性has one协会控制器 def create crossword Crossword new crossword params if crossword save render show
Ruby ActiveRecord 和 sql 元组支持

ActiveRecord 是否支持 where 子句中的元组假设底层数据库支持结果 where 子句看起来像这样 where name address in John 123 Main St I tried Person where n
Ruby 动态变量名

有没有办法在 Ruby 中创建具有动态名称的变量我正在读取一个文件当我找到一个字符串时会生成一个哈希值 e g file File new games log r file lines do l l split do p if p 1

随机推荐

Delphi 中的类/静态常量

在 Delphi 中我希望能够创建一个与类关联的私有对象并从该类的所有实例访问它在Java中我会使用 public class MyObject private static final MySharedObject myShare
在 xaml 窗口和用户控件 WPF 之间传递参数

如何将参数从 xaml 窗口传递到 WPF 用户控件构造函数我尝试过创建依赖属性但失败了我应该尝试 xaml 扩展还是有其他方法可以做到这一点
使用opencv检测肤色

如何检测皮肤的颜色使用OpenCV 使用 OpenCV 怎么样哈尔人脸检测器找到一个面部区域然后得到平均或最常见的颜色在那个脸部区域既然应该是肤色 Update 环境我的镜框将具有面部特征仅限从头发到肩膀如附件所示你真的不需要
片段选项卡和片段活动

我按照指南使用 Fragments 创建了一个应用程序以便我可以在更大的屏幕上显示更详细的视图不过我也想使用选项卡进行导航根据指南选项卡也应该是片段而不是已弃用的 TabHost 一些谷歌搜索表明你不能不应该嵌套片段我的问题
在 Java 中解析日期格式

我正在尝试用 Java 将日期转换为 Unix 时间戳我的日期示例为 Fri Jun 05 15 53 07 PDT 2009 我的代码是 DateFormat dateFormat new SimpleDateFormat EEE MM
忽略 R 字符串中的转义字符（反斜杠）

在 SPSS 中运行 R 插件时我收到一个 Windows 路径字符串作为输入例如 C Users mhermans somefile csv 我想在后续的 R 代码中使用该路径但是需要用正斜杠替换斜杠否则 R 将其解释为转义符例
如何在 R 中为 tableGrob 自定义特定列？

我正在寻找自定义 tableGrob 中的特定列对于这个可重现的示例我选择查看自定义理由假设您有以下数据框 df lt data frame Order c 1 3 Name c Adam Ben Charlie Score c 4
为 R 中具有相同符号的连续数字的每个范围分配一个值

我正在尝试创建一个数据框其中存在一列该列保存表示正数和负数的运行长度的值如下所示 Time V Length 0 5 2 1 5 1 0 1 1 5 1 5 0 0 0 2 0 2 1 0 2 5 0 0 0 3 0 1 1 75 3
PHP exec() 未在输出中返回错误消息

我正在尝试以 XML 格式获取 svn 命令的某些输出当我输入有效参数时输出正常但是当我输入错误的密码时输出不会显示错误消息这是 PHP 代码 exec usr bin svn username something passwor
Laravel 4 分页计数

我在我的特定视图站点中设置了分页并且它有效问题是我有一个 php 计数器 foreach players as player tr td count td 每当我切换页面时它都会从 1 开始我怎样才能改变这一点为了实现这一点您
Selenium 不使用 InternetExplorerDriver 单击按钮的解决方法

我在网页上有一个按钮当我通过 IE 运行时 Webdriver 不会单击该按钮我已经尝试了以下解决方法但没有成功通过 JavaScript 点击 JavascriptExecutor driver executeScript arg
在 C 中使用 strncpy 更有效地复制 n 个字符

我想知道是否有一种更干净更有效的方法来执行以下操作strncpy考虑到max字符数我觉得自己做得太过分了 int main void char string hello world foo int max 5 char str mall
从类访问 LocationManager/ LocationListener

我有点迷失在这里在我的主要活动中我注册了一个 LocationManager 并将其连接到 LocationListener 以使用 myLocation getLatitude 等现在我需要使用另一个类中的 Location 方法
数据注释或应用程序验证块

DataAnnotations 和应用程序验证块有什么区别 DataAnnotations 是一个基于属性的模型用于注释数据它位于 NET 框架本身中它最明显的用途是验证例如 ASP NET MVC 所做的那样 Validati
biglm 和 lm 之间的 AIC 不同

我一直在尝试使用 biglm 在大型数据集大约 60 000 000 行上运行线性回归我想用AIC来进行模型选择然而当我在较小的数据集上使用 biglm 时我发现 biglm 返回的 AIC 变量与 lm 返回的变量不同这甚至
如何确定隐藏/溢出文本是在元素的顶部还是底部

我想扩展 Shog9 的答案如何从javascript判断html元素是否有溢出内容 https stackoverflow com questions 143815 how to determine from javascript if
SQL 查询忽略相邻的匹配行

我有一个活动表其中包含各种活动和哈希值 actorEntity subjectEntity activity type 在某些情况下用户可能会在几秒钟内执行完全相同的活动两次这意味着数据库中会有两个相邻的行具有完全相同的数据对于某些
Objective-C 中的“isa”变量是否等于 Java 中的“instanceof”

简单的问题 Objective C 中的 isa 实例变量提供与 Java 中的 instanceof 运算符相同的功能是否公平这些是不同的概念一个是一个member一个结构体而另一个是一个operator 模仿严格的解释instan
如何创建一个仅在其类型具有特定成员函数时才编译的类？ [复制]

这个问题在这里已经有答案了我有一个名为has f我希望它只接受具有以下内容的模板参数f成员函数我该怎么做呢这是我尝试过的 template
在 Ruby 中将转义的 unicode (\u008E) 转换为重音字符 (Ž)？

我对此感到非常困难 contained within MA u008EEIKIAI should be MA EIKIAI nature of string p string3 MA u008EEIKIAI puts string3 MAE

在 Ruby 中将转义的 unicode (\u008E) 转换为重音字符 (Ž)？

在 Ruby 中将转义的 unicode (\u008E) 转换为重音字符 (Ž)？ 的相关文章

随机推荐

热门标签

在 Ruby 中将转义的 unicode (\u008E) 转换为重音字符 (Ž)？的相关文章