ruby 中的字节与代码点

2024-01-14

ruby 字符串函数之间有什么区别：- 代码点和字节

'abcd'.bytes
=> [97, 98, 99, 100]

'abcd'.codepoints
=> [97, 98, 99, 100]

bytes无论字符大小如何，都返回单个字节，而codepoints返回 unicode 代码点。

s = '日本語'
s.bytes # => [230, 151, 165, 230, 156, 172, 232, 170, 158]
s.codepoints # => [26085, 26412, 35486]
s.chars # => ["日", "本", "語"]

我明白你的困惑来自哪里。 Ruby 现在默认使用 utf-8 编码，并且 utf-8 是专门设计的，因此它的第一个代码点（0-127）是exactly与 ASCII 编码相同。 ASCII 是一种单字节字符的编码，因此在问题方法的示例中bytes and codepoints返回相同的值，巧合地.

因此，如果您需要将字符串分解为字符，请使用chars or codepoints（无论哪个适合您的用例）。使用bytes仅当您将字符串视为不透明的二进制 blob 而不是文本时。

实际上，chars（上面建议的）可能不够准确，因为 unicode 有组合字符和修饰字母的概念。如果你关心这个，你需要使用所谓的“字素簇”。这是一个例子（取自这个答案 https://stackoverflow.com/a/54457724/125816:

s = "a\u0308\u0303\u0323\u032d"
s.bytes # => [97, 204, 136, 204, 131, 204, 163, 204, 173]
s.codepoints # => [97, 776, 771, 803, 813]
s.chars # => ["a", "̈", "̃", "̣", "̭"]
s.grapheme_clusters # => ["ạ̭̈̃"] # rendering of this glyph is kinda broken, which illustrates the point that unicode is hard

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ruby

ruby 中的字节与代码点的相关文章

mongoid 中的嵌入文档与哈希数据类型

我找不到任何讨论此问题的博客文章或文档它们嵌入式文档和哈希数据类型非常相似彼此相比有何好处或限制考虑我的架构设计 class HistoryTracker include Mongoid Document include Mong
迭代比线性代码慢吗？哪一个更可取？

最近几天我脑子里一直有一个问题在用 ruby 编写代码时线性代码是否比迭代更快更好让我举个例子有一个用于相同功能的代码块以两种不同的方式编写 Way 1 dog cat tiger each do pet name puts I
如何阻止“gem”实用程序访问我的主目录？

当我跑步时 gem install
如何在保存父对象时确保子对象有效？

假设我有两堂课 class User attr accessible name has one address validates name presence gt true validates associated address end
模块何时包含在在 Rails 中运行的 Ruby 类中？

我正在尝试编写一个方法来告诉我包含特定模块的每个类它看起来像这样 def Rating rateable objects rateable objects ObjectSpace each object Class do c next u
使用brew时出现“错误的解释器”错误

当我尝试运行任何 brew 命令时出现此错误 Holger Sindbaeks MacBook Air holgersindbaek brew help bash usr local bin brew usr bin ruby bad i
设计重定向到成功登录似乎在第一次登录尝试时卡住

我正在使用 Ruby on Rails 开发一个小型应用程序并使用 Devise 进行身份验证我有两个登录系统设置一个是user另一个是employee 当使用正确的电子邮件和密码登录时设计会发送正确的重定向到返回路径但它会卡在那
Rails 5 - 在 gem 上充当 Taggable - 简单表单集合选择已定义的标签列表

我正在尝试学习如何将 Acts as Taggable On gem 与 Rails 5 一起使用我使用简单的表格作为表格我认为部分问题是由于提案和 randd fields 之间的模型没有关联而产生的我有名为 Proposal 和
ruby 中的树和图数据结构[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我很难找到在 ruby 中使用的树数据结构我可以研究一些众所周知的吗我的要求很简单我想创建一棵树或者可能是一个图并找到一些节点之
什么时候需要将参数传递给“Thread.new”？

在线程外部定义的局部变量似乎从内部可见因此以下两种用法Thread new似乎是一样的 a foo Thread new puts a gt foo Thread new a a puts a gt foo The document ht
未签出...捆绑安装无法修复帮助！

https github com intridea omniauth git at master is not checked out Please run bundle install Bundler GitError 那我该怎么办捆绑
如何从 method_missing 获取绑定？

我试图找到一种方法来从 Ruby 1 8 中的 method missing 中的调用者获取绑定但我似乎找不到方法来做到这一点希望下面的代码能解释我想做的事情 class A def some method x 123 nonexist
如何将可求和指标压缩为 ruby 表中的唯一标识符

我正在尝试将可求和指标压缩为 ruby 表中的唯一标识符我有下表 id1 123 id2 234 id1 345 压缩指标最有效的方法是什么使其看起来像这样 id1 468 id2 234 我认为其他回答者想太多了您只需一次操作即可完
Ruby 中的关键字在哪里定义？

我正在查看 Ruby 文档想知道是否一切都是对象那么关键字也是对象对吗如果是这样它们在 ruby 中是在哪里定义的下面的页面完全让我困惑因为它显示了包含所有关键字的对象但这不是所有类使用的官方对象这是否以某种方式来自不
在 Rails ActiveAdmin 视图中添加指向 Flash 通知的链接

我正在尝试在活动管理控制器成功创建操作的闪存消息中添加链接但是该链接的 HTML 被转义并在视图上显示为纯文本 Rails 5 2 1 ruby 2 5 3p105 2018 10 18 修订版 65156 x86 64 linux 例如
在 Rails 5.1 及更高版本中，使用什么来代替“render :text”（和“render Nothing: true”）？

轨道 5 1 其中就有老朋友render text 当你需要渲染的时候它非常有用some文本但不想要视图模板的开销例子 render text ok render text t business rules project access
使用 google-drive-ruby gem 在 google 云端硬盘中创建文件夹

我知道这里提出了类似的问题但是我仍然无法完成这项工作因为我的情况有点不同我希望能够使用以下命令在谷歌驱动器中创建一个文件夹谷歌驱动器红宝石宝石 https github com gimite google drive ruby 根据谷
需要 gem 是否会加载所有内容，包括我不使用的东西？

Assume x是一颗宝石包含两者Hello and Goodbye类如果我写一个程序require x 但仅使用Hello班级是个Goodbye类也加载了吗您包含脚本或文件而不是 gem With require x 你加载文件
Jekyll 站点仅在推送到 GitHub 时才会失败

我正在使用 Jekyll 开发一个新版本的静态网站该网站通过 Github 页面部署 https devcampy com https devcampy com 存储库 https github com gianarb devcampy
了解 Ruby 的加载路径

我有点困惑为什么我的项目无法加载它需要的文件这是一个非常简单的项目树 processor bin lib processor rb processor mapper rb reducer rb and my processor rb文件看

随机推荐

从文件末尾开始读取，类似于tail

在本机 C 中如何从文件末尾读取内容这是相关的因为我需要读取日志文件而读取 10k 读取最后 3 行是没有意义的要读取最后 1024 个字节 using var reader new StreamReader foo txt if
在 pandas 中使用多索引数据帧进行索引

考虑以下示例数据 data Taxon Firmicutes 5 Patient range 5 Tissue np random randint 0 1000 size 5 Stool np random randint 0 1000 s
如何使用 MySQL 分别对列进行计数和分组？

我有一个调查应用程序正在处理结果页面对于每个问题页面应显示提供的不同答案以及每个答案提供的次数有些问题可以接受多个答案例如假设以下是这样一个问题你感觉怎么样 Good Bad Okay 这意味着任何组合Good Bad and
Android Studio 3.1.4：ANDROID_SDK_HOME 设置为 SDK 的根目录

Error SDK Validation ANDROID SDK HOME is set to the root of your SDK C Users Ali Asadullah AppData Local Android sdk Thi
用于识别未标记文本的 XPath 查询

考虑这个 HTML table tr td h1 title h1 h3 item 1 h3 text details for item 1 h3 item 2 h3 text details for item 2 h3 item 3 h3
MediaPlayer.OnCompletionListener 和 View.OnClickListener？

我目前正在尝试 extends Activity implements MediaPlayer OnCompletionListener extends Activity implements View OnClickListener 同时
如何设置 JUnit 测试的日志级别

我在我的课程中使用 java 日志记录 Example public class MyClass private static Logger logger Logger getLogger MyClass class getName 当我为
HAXM 无法在 Linux 上运行

我们在这里GingerBread http software intel com en us blogs 2012 03 12 how to start intel hardware assistedvirtualization hyper
复制 TensorFlow contrib 层

这是我的代码 sess tf Session input tf placeholder tf float32 None 3 w1 tf contrib layers fully connected input 1 w2 tf contrib
ReactJS - 标记上的未知属性 `activeClassName`。从元素中删除此道具

我正在使用react 15 4 2和react router4 0 0 这个项目是用创建反应应用程序 https github com facebookincubator create react app 这是我的代码 import Rea
通过脚本将网站和 FTP 添加到 IIS 7 中

我们正在将 100 多个域转移到新服务器我创建了一个脚本允许使用简单的 BAT 文件将网站条目和 FTP 条目添加到 IIS 7 中我发现了几个使用 AppCmd ADD SITE 的教程效果非常好通过运行 c scripts c
lldb 可以与 fortran 一起使用吗？

我正在尝试对 Fortran 程序设置断点lldb在 Mac OS 10 12 5 系统上我有 program badcall integer a b a 2 b 3 write a b end I have to 使用英特尔编译器进行编
在批处理文件中显示 .txt 的内容？

我现在正在处理一个批处理文件我已经完成了我需要的一切但我陷入了困境我使用的程序之一会输出一个日志文件我让它将该文件放在 C 驱动器上的一个文件夹中我想做的是让它读取这个 txt 并将其作为回显返回到批处理文件中您可以将其放入批处
如何设置 jQuery UI 对话框默认值

如何设置 jQuery UI 对话框的默认值例如这就是我在 jQuery UI 日期选择器中设置默认值的方式 datepicker setDefaults dateFormat dd mm yy 我在中找不到相同的功能对话文档 htt
如何在 Emacs 初始化文件中生成键盘宏？

我经常定义一个特定的键盘宏因此我认为如果每次加载 Emacs 时它都自动可用可能会很方便我怎样才能做到这一点怎么样保存键盘宏 http www gnu org software emacs manual html node emac
Android模拟器和virtualbox不能同时运行

每当我运行 Virtualbox 时我都无法启动 Android 模拟器映像反之亦然 AVD管理器中的错误消息是 ioctl KVM CREATE VM failed Device or resource busy ko failed
PowerShell - 匹配运算符和多个组

我正在 PowerShell 中处理以下日志条目我正在尝试使用以下命令提取所有活动名称和持续时间 match操作员但我只拿回一组比赛当我使用 C 做同样的事情时我没有得到我看到的所有匹配项Regex目的有人可以解释我做错了什么吗
在 lucene 索引中存储和检索 Json 对象

我已经将一组 json 对象存储到 lucene 索引中并且还想从索引中检索它我使用的是lucene 3 4 那么有没有任何库或简单的机制可以在 lucene 中实现这一点例如 Json 对象 BOOKNAME1 id 1 name
Python Pandas 警告：尝试在 DataFrame 切片的副本上设置值

我有一个 Pandas DataFrame 我想用以下代码更改列的所有值 df Population round df Population 1000000 1 我收到以下警告 A value is trying to be set on
ruby 中的字节与代码点

ruby 字符串函数之间有什么区别代码点和字节 abcd bytes gt 97 98 99 100 abcd codepoints gt 97 98 99 100 bytes无论字符大小如何都返回单个字节而codepoints返回

ruby 中的字节与代码点

ruby 中的字节与代码点 的相关文章

随机推荐

热门标签

ruby 中的字节与代码点的相关文章