为什么 Julia 不鼓励对 UTF8 字符串建立索引？

2023-12-21

Julia 的入门指南，在 Y 分钟内学习 Julia https://learnxinyminutes.com/docs/julia/，阻止用户索引 UTF8 字符串：

# Some strings can be indexed like an array of characters
"This is a string"[1] # => 'T' # Julia indexes from 1
# However, this is will not work well for UTF8 strings,
# so iterating over strings is recommended (map, for loops, etc).

为什么不鼓励迭代这样的字符串？这种替代字符串类型的结构具体是什么导致索引容易出错？这是 Julia 特有的陷阱，还是扩展到所有支持 UTF8 字符串的语言？

因为在 UTF8 中，字符并不总是以单个字节编码。

以德语字符串为例böse（邪恶的）。该字符串在UTF8编码下的字节为：

0x62 0xC3 0xB6 0x73 0x65
b    ö         s    e

正如你所看到的元音变音ö需要 2 个字节。

现在如果你直接索引这个UTF8编码的字符串"böse"[4]会给你sand not e.

但是，您可以在 julia 中将字符串用作可迭代对象：

julia> for c in "böse"
           println(c)
       end
b
ö
s
e

既然您已经问过，不，UTF8 字符串的直接字节索引问题并不是 Julia 特有的。

进一步阅读建议：
http://docs.julialang.org/en/release-0.4/manual/strings/#unicode-and-utf-8 http://docs.julialang.org/en/release-0.4/manual/strings/#unicode-and-utf-8

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

string

UTF8

Julia

为什么 Julia 不鼓励对 UTF8 字符串建立索引？的相关文章

从字符串中删除重音符号

Android 中有没有什么方法据我所知没有 java text Normalizer 可以从字符串中删除任何重音例如变成 eau 如果可能的话我想避免解析字符串来检查每个字符 java text NormalizerAndroi
List 或其他类型上的 string.Join

我想将整数数组或列表转换为逗号分隔的字符串如下所示 string myFunction List
SQLite 的不区分大小写的 UTF-8 字符串排序规则 (C/C++)

我正在寻找一种方法以不区分大小写的方式对 C 中的 UTF 8 字符串进行比较和排序以便在SQLite 中的自定义排序规则函数 http www sqlite org c3ref create collation html 该方法应该i
子字符串和 Go 垃圾收集器

在 Go 中获取字符串的子字符串时不会分配新的内存相反子字符串的底层表示包含一个数据指针该指针是原始字符串的数据指针的偏移量这意味着如果我有一个大字符串并希望跟踪一个小子字符串则垃圾收集器将无法释放任何大字符串直到我释放对较
将 NSAttributedString 的子字符串替换为另一个 NSAttributedString

我想替换一个子字符串例如 replace of an NSAttributedString和另外一个NSAttributedString 我正在寻找一种等效的方法NSString s stringByReplacingOccurrence
出现错误：字符串未被识别为 C# 中的有效日期时间

出现如下错误 mscorlib dll 中发生类型为 System FormatException 的未处理异常附加信息字符串未被识别为有效的日期时间我正在使用这段代码 string datetime DateTime Parse en
Java在字符串中看不到空格[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案因此我正在尝试解析一些具有多行文本的文本文件我的工作是检查所有单词并将其打印在文件中因此我读取了所有行循环遍历它们并用空格分隔每
为什么byteArray的长度是22而不是20？

我们尝试从字符串转换为Byte 使用以下 Java 代码 String source 0123456789 byte byteArray source getBytes UTF 16 我们得到一个长度为 22 字节的字节数组我们不确定这个
将字符串转换为字符并按降序排序（ascii）

我正在创建一个程序该程序将使用户输入整数一个接一个存储在数组中并按降序显示整数该程序还要求用户输入一个字符串使用以下命令将其转换为字符string toCharArray 我已经正确地按降序显示整数问题是我不知道如何按降序显示字
如何在Python中不使用库函数将字符串转换为整数？

我正在尝试转换 a 546 to a 546 不使用任何库函数我能想到的最纯粹 gt gt gt a 546 gt gt gt result 0 gt gt gt for digit in a result 10 for d in 01
奇怪的java字符串数组空指针异常[重复]

这个问题在这里已经有答案了这个问题是在实践测试中出现的创建一个新的字符串数组将其初始化为空然后初始化第一个元素并打印它为什么会出现空指针异常呢为什么它不打印一这与字符串不变性有关吗 public static void ma
R：如何将描述小时、分钟和秒的非直观字符串转换为可行的 POSIXct 格式以执行标准算术？

我在 R 中有一个数据集其值采用小时分钟和秒格式然而有些值只有小时和分钟有些值只有分钟和秒有些值只有分钟有些值只有秒它的格式也不是很有利样本数据如下 example lt as data frame c 22h28m 17
将字节数组编码解码为字符串而不丢失数据

我尝试将 byte 转换为字符串如下所示 Map
MySql 查询在选择中将 NULL 替换为空字符串

如何用空字符串替换 select 中的 NULL 值输出 NULL 值看起来不太专业这是非常不寻常的根据我的语法我希望它能够工作我希望能得到一个解释为什么没有 select CASE prereq WHEN prereq IS
正则表达式提取美国邮政编码，但不提取假代码

使用 XML 包和 XPath 从网站上抓取地址有时我只能得到一个嵌入了我想要的邮政编码的字符串提取邮政编码很简单但有时会显示其他五位数字的字符串以下是 df 中问题的一些变体 zips lt data frame id seq 1
Notepad++:: 通过正则表达式完全删除包含问号的行

嗯我想这就是我的标题这对于我将要实现的目标来说是不言自明的这是我当前的文本文件的示例 Diva was the winning song of the Eurovision Song Contest 1998 Who will win
在python中将文本文件解析为列表

我对 Python 完全陌生我正在尝试读取包含单词和数字组合的 txt 文件我可以很好地读取 txt 文件但我正在努力将字符串转换为我可以使用的格式 import matplotlib pyplot as plt import num
python 中分割字符串以获得一个值？

需要帮助假设我在名为 input 的变量中有一个字符串 Sam Person name kind input split 通过执行上述操作我得到两个具有不同字符串 Sam 和 Person 的变量有没有办法只获取第一个值 name S
SQL Server 转换选择一列并将其转换为字符串

是否可以编写一条从表中选择列并将结果转换为字符串的语句理想情况下我希望有逗号分隔的值例如假设 SELECT 语句看起来像这样 SELECT column FROM table WHERE column lt 10 结果是一列包含值的
为什么 strtok 会导致分段错误？

为什么下面的代码给出了Seg 最后一行有问题吗 char m ReadName printf nRead String s n m Writes OK char token token strtok m 如前所述读取字符串打印没有问题但

随机推荐

CefSharp WpfControl 和渲染到图像

我们想要在 wpf 应用程序中的基于 chromium 的浏览器中显示网页在浏览器中显示的网站也应该显示在另一个屏幕上但没有交互我想将 cefsharp wpf 浏览器控件和 cefsharp 离屏渲染结合起来我可以使用一个 chr
为什么 time.clock() 在 Windows Server 2008 X64 上返回如此大的值

我在不同的机器上运行以下脚本并得到了完全不同的结果经过的 time clock 太大了 Script import time start clock time clock time sleep 60 end clock time cloc
MacO 上的 PyOpenGL OpenGL 版本

有人告诉我将旧配置文件从其他 stackoverflow 帖子切换到核心配置文件但我似乎找不到方法来做到这一点因此我发布了一个更新的错误帖子来帮助我找到一种方法 CODE import glfw numpy from OpenGL G
如何将 YYYYMMDDHHMMSS 转换为“date”可读的日期

我有一组 YYYYMMDDHHMMSS 格式的日期时间字符串我想将其转换为可读的内容date公用事业通常我可以这样做 date d 2010 10 01 12 34 56 然而 date不喜欢 YYYYMMDDHHMMSS date
Python 相当于 Matlab 的clear、close all、clc

在Matlab中在每个文件的开头我通常写 clear close all clc Python中有类似的东西吗大多数人在测试脚本时会做什么这里的问题是 plt show 是阻塞的并且在手动关闭窗口之前不会返回到脚本您可以尝试 p
类型错误：__init_subclass__() 不接受关键字参数

我正在尝试创建一个元类但是当我将其分配给另一个类时我收到错误类型错误 init subclass 不接受关键字参数但我没有实施任何 init subclass 为什么要调用这个函数 class Meta type def new c
回形针 - 保存文件后运行方法？

我正在开发一个需要接受文件上传的项目文件上传后我正在进行一些处理从文件中提取信息我最终计划在后台工作程序中运行它但它目前正在内联运行我尝试使用 after create 和 after save 来处理文件但似乎我的方法是在
如何在 MATLAB 编辑器中启用自动单词完成功能？

我可以通过按 Tab 在 MATLAB 命令提示符下使用自动单词完成功能但在使用 m 文件的编辑器时无法执行此操作有什么方法可以在编辑器中使用制表符补全吗根据这篇 MathWorks 博客文章 http blogs mathworks
LinkedIn 分享按钮 - 无法识别 og:image

我正在尝试与 og 标签共享页面其中一个标签是 og image 如以下链接所述 https developer linkedin com documents setting display tags shares https devel
在 vim 中打开与当前文件相同的文件夹中的文件

在vim中当我打开一个缓冲区时我经常需要加载该文件所在目录中的另一个文件但因为我通常不这样做cd进入其中将pwd是父文件夹所以我每次都必须重新输入路径这有捷径吗或者将密码更改为文件所在目录的方法 example cd src
如何确定一个 3D 对象是否适合另一个 3D 对象（容器）？

给定两个 3D 对象我如何找到一个是否适合第二个对象并找到该对象在容器中的位置应平移和旋转对象以适合容器但不得进行其他修改其他并发症相同的情况但寻找最适合的解决方案即使它不是正确的匹配最小化不适合容器的物体的体积支持弹性
Puppeteer：如何监听对象事件

是否可以监听页内对象调度的事件假设我访问的页面中有以下代码 var event new CustomEvent status detail ok window addEventListener status function e cons
强制 git push + pull 超时

我发现的所有问题都想避免 git 推拉超时就我而言我想强迫他们我的推拉都是通过 ssh 传输到在某个时间点可能不可用的远程计算机例如我有一个脚本可以推送到两个远程公共存储库我不希望这个脚本在推送到第一个存储库并且该机器不可用
Flexslider 和从右到左的语言支持

我在 WordPress 上安装了一个包含 Flexslider 的模板我的语言是从右到左 RTL 书写的当页面为 RTL 时 Flexslider 停止并且不显示图像我该如何解决这个问题 Flex 滑块不支持 RTL 语言解决这个
C++：崩溃时不显示 glibc 的回溯和内存映射

我正在使用 Python 进行自动 C 代码测试所以我有一个编译和执行 C 代码的 Python 脚本当 C 代码崩溃时即使我重定向 libc 输出也可以从我的 Python 脚本输出中看到cout and cerr正在执行的 C 程
从数据库更新模型时出现实体框架错误，反之亦然

当我尝试使用 VS Express 2013 for web EF6 1 1 和 NET Framework 4 5 从数据库更新模型时会发生以下情况在本例中我只是在表定义中向表中添加了一个字段并更新了数据库之后我在 EDMX 模
使用GridSearchCV时出现值错误

我正在使用 GridSearchCV 进行分类我的代码是 parameter grid SVM dual True False loss squared hinge hinge penalty l1 l2 clf GridSearchCV
Autofac PropertiesAutowired - 是否可以忽略一个或多个属性？

尽管建议通过构造函数传递依赖项但我发现使用无参数构造函数然后自动装配所有属性的开发成本显着减少并使应用程序更易于开发和维护然而有时例如在视图模型上我有一个在容器中注册的属性但我不想在构造时填充该属性例如绑定到容器的所选项目有
谷歌移动视觉库无法下载

我正在尝试将 Google Mobile Vision TextRecogniser API 实现到我的应用程序中以读取给定图像中的文本当我尝试使用该功能时出现以下错误 W DynamiteModule Local module de
为什么 Julia 不鼓励对 UTF8 字符串建立索引？

Julia 的入门指南在 Y 分钟内学习 Julia https learnxinyminutes com docs julia 阻止用户索引 UTF8 字符串 Some strings can be indexed like an ar

为什么 Julia 不鼓励对 UTF8 字符串建立索引？

为什么 Julia 不鼓励对 UTF8 字符串建立索引？ 的相关文章

随机推荐

热门标签

为什么 Julia 不鼓励对 UTF8 字符串建立索引？的相关文章