raku 可以避免这个 Malformed UTF-8 错误吗？

2024-05-16

当我运行这个 raku 脚本时......

my $proc = run( 'tree', '--du', :out);
$proc.out.slurp(:close).say;

我在 MacOS 上遇到此错误...

Malformed UTF-8 near bytes ef b9 5c

...而不是这样的东西treezsh 的输出这就是我想要的......

.
├── 00158825_20210222_0844.csv
├── 1970-Article\ Text-1971-1-2-20210118.docx
├── 1976-Article\ Text-1985-1-2-20210127.docx
├── 2042-Article\ Text-2074-1-10-20210208.pdf
├── 2045-Article\ Text-2076-1-10-20210208.pdf
├── 6.\ Guarantor\ Form\ (A).pdf

我努力了slurp(:close, enc=>'utf8-c8')并且错误是相同的。

我也尝试过...

 shell( "tree --du >> .temp.txt" );
 my @lines = open(".temp.txt").lines;
 dd @lines;

...并且错误是相同的。

打开 .temp.txt 揭示了这一点......

.
â<94><9c>â<94><80>â<94><80> [    1016739]  True  
â<94><9c>â<94><80>â<94><80> [ 9459042241]  dir-name
â<94><82>Â Â  â<94><9c>â<94><80>â<94><80> [     188142]  Business
â<94><82>Â Â  â<94><82>Â Â  â<94><9c>â<94><80>â<94><80> [       9117]  KeyDates.xlsx
â<94><82>Â Â  â<94><82>Â Â  â<94><9c>â<94><80>â<94><80> [      13807]  MondayNotes.docx

文件-我给出这个...

.temp.txt: text/plain; charset=unknown-8bit

有什么建议吗？

[这是Catalina 10.15.17，终端编码Unicode(UTF-8) 欢迎来到????????????????????????™ v2020.10。实施????????????????™ 编程语言 v6.d。基于 MoarVM 版本 2020.10 构建。]

您的代码页/区域设置似乎不是 Utf8。（或者tree忽略代码页并使用不同的东西。）

快速……从中得到一些东西，任何东西；就是使用8位单字节编码。

run( 'tree', '--du', :out, :enc<latin1> );

一般来说，查看 Utf8 解码在哪里开始出错就足够了。

也就是说，让我们看看您的预期输出和文件输出。

say '├──'.encode; # utf8:0x<E2 94 9C E2 94 80 E2 94 80>

在你的文件中有

â<94><9c>â<94><80>â<94><80> [    1016739]  True

Wait …

say 'â'.encode('latin1'); # Blob[uint8]:0x<E2>

<E2><94><9c><E2><94><80><E2><94><80>

       <E2 94 9c E2 94 80 E2 94 80>

utf8:0x<E2 94 9C E2 94 80 E2 94 80>

是的，它们看起来非常相似。
因为它们是完全相同的。

因此，它似乎确实在某种程度上产生了预期的产出。

这似乎证实了，是的，中间存在编码问题tree和你的代码。这表明代码页/区域设置设置错误。

您还没有真正提供足够的信息来准确找出问题出在哪里。你应该用过run以二进制模式为我们提供准确的输出。

say run('echo', 'hello', :out, :bin).out.slurp;
# Buf[uint8]:0x<68 65 6C 6C 6F 0A>

你也没说如果<9c>在文件中实际上是四个文本字符，或者它是您用来打开文件将二进制数据转换为文本的任何功能的功能。

如果所有示例数据都是相同的，那就太好了。

稍微相关的说明......

Since tree给出文件名，并且文件名不是 Unicode, using utf8-c8放在这里是合适的。
（用户名和密码通常也是如此。）

这是我在计算机上运行的一些代码，希望能说明原因。

say dir(:test(/^ r.+sum.+ $/)).map: *.relative.encode('utf8-c8').decode
# (résumé résumé résumé résumé)

dir(:test(/^ r.+sum.+ $/)).map: *.relative.encode('utf8-c8').say
# Blob[uint8]:0x<72 65 CC 81 73 75 6D 65 CC 81>
# Blob[uint8]:0x<72 C3 A9 73 75 6D 65 CC 81>
# Blob[uint8]:0x<72 C3 A9 73 75 6D C3 A9>
# Blob[uint8]:0x<72 65 CC 81 73 75 6D C3 A9>

say 'é'.NFC;
# NFC:0x<00e9>
say 'é'.NFD
# NFD:0x<0065 0301>

sub to-Utf8 ( Uni:D $_ ){
   .map: *.chr.encode
}

say to-Utf8 'é'.NFC
# (utf8:0x<C3 A9>)
say to-Utf8 'é'.NFD
# (utf8:0x<65> utf8:0x<CC 81>)

So é要么被编码为一个组合代码点<C3 A9>或两个分解的代码点<65> <CC 81>.

我真的只是为了这个目的创建了 4 个“同名”文件吗？
是的。是的，我做到了。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Unicode

raku

raku 可以避免这个 Malformed UTF-8 错误吗？的相关文章

ASCIIEncoding.ASCII.GetBytes() 返回意外值

这段 C 代码 string s u00C0 byte bytes ASCIIEncoding ASCII GetBytes s Trace WriteLine BitConverter ToString bytes 产生以下输出 3F 为
如何在javascript中删除一组表情符号中的最后一个表情符号？

假设我的字符串中有 3 个表情符号字符串中没有任何空格或除表情符号之外的任何其他字符如何删除javascript中最后一个表情符号下面的答案不使用任何特殊的包并安全地删除最后一个表情符号 function safeEmojiBacks
Windows 上的 wchar_t 和 char16_t 是一样的吗？

我有一个实例std u16string 我可以通过它吗c str 到一个 Win32 API 它期望LPCWSTR 没有任何类型的转换例如我可以安全地这样做吗 auto u16s std u16string u Hello SetWin
CSV、Python：正确使用 DictWriter（ValueError：dict 包含不在字段名中的字段）

我在掌握 csv 模块 Python 2 7 中的 DictWriter 时遇到困难我有这个哦我正在使用 unicodecsv 库因为我读到存在问题 f object instance return a dictionary key
如何在 Java/Eclipse 中使用特殊字符

如何在 Java Eclipse 中使用显示或等字符当我尝试直接使用它们时例如在源代码中 Eclipse无法保存文件我能做些什么编辑如何找到 unicode 转义序列问题是您使用的字符无法以文件设置的编码 Cp1252 表
Java中的字节和字符转换

如果我将一个字符转换为byte然后回到char 那个角色神秘地消失了变成了别的东西这怎么可能这是代码 char a line 1 byte b byte a line 2 char c char b line 3 System out
如何去除 XSL 中字符的重音符号？

我一直在寻找但找不到相当于字符规范化空间的 XSL 函数也就是说我的内容带有重音 UNICODE 字符这很好但是从该内容中我正在创建一个文件名但我不想要这些重音那么是否有一些我忽略的东西或者没有正确地谷歌搜索来轻松处
perl6 IO::Socket::INET 无法从套接字接收数据：连接被对等方重置

示例服务器 usr bin env perl6 my listen IO Socket INET new listen localhost
使用十进制数有理数是否会影响 Perl 6 的性能

据我了解 Perl 6 尽可能将小数实现为有理数以避免大多数其他语言中存在的浮点问题有人做过基准测试或了解这样做的性能损失吗使用十进制数有理数是否会影响 Perl 6 的性能我认为最有用的总体答案是不不是真的但让我详细说明一下
如何在 SVG 中显示 unicode？

以 SVG 格式存储在数据库中的信息如果数据包含文本它将显示为 Unicode 有必要在浏览器中正确显示 SVG 文件
如何解决 PDFBox 没有 unicode 映射错误？

我有一个现有的 PDF 文件我想使用 python 脚本将其转换为 Excel 文件目前正在使用PDFBox 但是存在多个类似以下错误 org apache pdfbox pdmodel font PDType0Font toUnico
如何在 C 中安全地声明 16 位字符串文字？

我知道已经有一个标准方法前缀为L wchar t test literal L Test 问题是wchar t不保证是16位但是对于我的项目我需要16位wchar t 我还想避免通过的要求 fshort wchar 那么 C 不是 C
如何在按键时识别 unicode 键？

我的应用程序使用 unicode 字符并且我有几个文本字段我想限制用户输入特殊字符例如 begin if not Key in a z A Z 0 9 13 8 then Key 0 if Key 13 then bOk Click
当从 html 文件读取 Unicode 内容时，为什么 Unicode 字体在 QTextBrowser 中无法正确显示？

我正在读一本html文件该文件基本上包含Unicode案文如下 b akko sati kru akkh ti khy abbahati b h b But the QText浏览器不解释Unicode字体所以QText浏览器显示如下
如何在 Linux 中重新添加 unicode 字节顺序标记？

我有一个相当大的 SQL 文件它以 FFFE 的字节顺序标记开头我使用 unicode 感知的 linux 分割工具将此文件分割成 100 000 行块但是当将这些传递回窗口时它确实not与第一个部分以外的任何部分一样只是它具有
如何查明我的字符串是否包含“micro”Unicode 字符？

我有一个包含实验室数据的 Excel 电子表格如下所示 g L ppb 我想测试希腊字母是否存在如果发现我需要做一些特别的事情通常我会写这样的东西 if cell StartsWith matchSequence lt unive
用 unicode 字符删除纯文本？

是否可以删除代码注释中不需要的修改过的单词由于开发人员仍然在黑暗时代更简单的纯文本时代进行编码其中文本无法使用隐藏标识符进行格式化因此实现这一目标的唯一方法是使用 Unicode 字符由于某些unicode字符可以扩展 y o n
什么是代码页 0？

我正在使用Delphi函数 StringCodePage 我在 COM 函数 Acrobat Annotation getContents 请参阅我的其他帖子返回的字符串上调用它它返回 0 0是什么安西代码页 0 是 CP ACP
Json.dump 失败并显示“必须是 unicode，而不是 str”TypeError

我有一个 json 文件其中恰好有大量中文和日文以及其他语言字符我将其加载到我的 python 2 7 脚本中使用io open如下 with io open multiIdName json encoding utf 8 as j
如何在 Android 上的 HttpPost 中发送 unicode 字符

我试图在我的应用程序中允许多语言支持这会发出 HTTP post 来上传新消息我需要做什么才能支持日语和其他非拉丁语语言我的代码目前看起来像这样 note the msg string is a JSON message by the

随机推荐

Map.Entry 的比较器

我有一个以枚举类型作为键以 Double 作为值的 Map 我想根据 Double 值对其进行排序所以我得到了条目集并想使用Collections sort 与比较器我有以下比较器代码 class ScoreComparator
未找到“MongoId”类（带有 MongoDB Doctrine 的 Zend 框架）

我目前正在尝试将 MongoDB 与 ZendFramework 中的 Doctrine 集成我做了很多教程在 StackOverflow 或其他地方但没有任何效果我一步步按照教程进行操作 http www bigwisu com
遵循 http://ruby.railstutorial.org/ 教程时出现 RSpec 错误

我到处搜索但似乎找不到解决方案我一直在关注有关的教程http ruby railstutorial org http ruby railstutorial org 我在第 3 章中尝试使用 rspec spec 执行测试但是我不断收到以
Android SDK 管理器不工作

启动 Eclipse 时我收到一条消息 This version of ADT requires Android SDK Tools revision 21 0 0 rc9 or above Current version is 10 0
如何将 Perl 转换为 C？

有没有可用的工具可以将 Perl 源代码转换为 C 源代码什么平台都可以对此的规范答案是MJD 的为什么不将 Perl 翻译成 C http www perl com pub a 2001 06 27 ctoperl html
您的 APK 版本代码应高于 378

几个月前我在 Phonegap Build 中创建了一个 Android 应用程序它工作正常可以在 Play 商店上使用我已经发布了我的应用程序的几个更新并且都已成功发布但今天我想发布我的应用程序的新更新但它显示错误您的 A
无法按住 CTRL+拖动 NSButton 到自定义 NSView 标题

我想创建一个自定义的NSTableCellView由 Interface Builder 实例化我已将 Table Cell View 类设置为MyTableCellView 并正确创建MyTableCellView NSTableCel
Android getAllCellInfo() 返回 null

我是android新手我正在研究一个项目该项目收集手机观察到的所有细胞信息我用过TelephonyManager getAllCellInfo 方法但它总是返回null 我的代码 public class NetworkCovera
如何在 SwiftUI 中使用带条件检查的按钮进行导航

Since 导航按钮不再可用我如何检查条件导航链接为了导航到另一个视图 NavigationLink destination Dashboard userName self userId password self password is
如何在 Python 中比较日期和日期时间？

这是我尝试执行的一个小片段 gt gt gt from datetime import gt gt gt item date datetime strptime 7 16 10 m d y gt gt gt from date date t
使用 Spring Data JPA 和 @Query 注释仅获取第一个/最后一个元素

EDIT 关于此问题的第二个和第四个答案提供了此问题的解决方案Spring Data JPA 注释的 setMaxResults https stackoverflow com questions 9314078 setmaxresults
尽管我可以在 DefinedTypes 中看到该类，但 Assembly.CreateInstance 返回 null

我使用以下方法加载新的程序集并将类的实例创建到新的 AppDomain 中 private static object CreateInstanceFromBinary AppDomain appDomain string typeName
YARN UNHEALTHY 节点

在我们的 YARN 集群已满 80 的情况下我们看到一些纱线节点管理器被标记为不健康在深入研究日志后我发现这是因为数据目录的磁盘空间已满 90 出现以下错误 2015 02 21 08 33 51 590 INFO org apach
如何完全禁用签名程序集？

我有一个包含多个项目的 VS NET 2010 解决方案我刚刚添加了一个新的库项目 the library assembly 启动项目是一个网站当我运行该网站时出现以下错误无法加载文件或程序集 the library assembl
在 OS 5 模拟器上安装 OTA 黑莓应用程序时遇到问题

我正在尝试在 eclipse helios 中使用 apache tomcat 5 5 测试我的 bb 应用程序的 OTA 部署我尝试从黑莓 OS 5 OS 6 和 OS 7 模拟器进行 OTA 安装这些应用程序已下载并安装在 OS 6
如何强制关闭 TcpListener

我有一个通过 tcpListener 进行通信的服务问题是当用户重新启动服务时抛出地址已在使用异常并且服务在几分钟左右无法启动有没有办法告诉系统终止旧连接以便我可以打开一个新连接我不能只使用随机端口因为服务无法通知客户端端
如何让Javamelody使用不同的端口（Spring Boot+暴露的两个HTTP端口）

我有 Spring Boot Web 应用程序它在端口 8080 上公开 REST API 它还通过 Spring Boot 管理端点公开管理端口 8081 http docs spring io spring boot docs cur
JavaScript 中 null 和 undefined 的区别？

根据JavaScript 中 null 和 undefined 有什么区别 https stackoverflow com questions 5076944 what is the difference between null and
Spring Tool Suite 3.5.0 上的 Spring Roo 项目 [已关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我已经安装了 Spring Tool Suite 3 5 0 STS 我期望能够在 STS 中创建一个 Spring Roo 项目就像过
raku 可以避免这个 Malformed UTF-8 错误吗？

当我运行这个 raku 脚本时 my proc run tree du out proc out slurp close say 我在 MacOS 上遇到此错误 Malformed UTF 8 near bytes ef b9 5c 而不是

raku 可以避免这个 Malformed UTF-8 错误吗？

raku 可以避免这个 Malformed UTF-8 错误吗？ 的相关文章

随机推荐

热门标签

raku 可以避免这个 Malformed UTF-8 错误吗？的相关文章