使用 Cp500 编码陌生事物（LF 和 NEL）

2024-04-15

最近，在从字节转换为字符串，然后再从字符串转换为字节的过程中，我遇到了 Cp500 (EBCDIC) 编码的奇怪问题。

问题在于一个特定的角色就是在这个转变过程中，被转变为这个角色.

下面的代码验证了这一点：

byte[] b25 = { 0x25 };
byte[] b4E = { 0x4E };

System.out.printf("\n0x25 in hex : <0x%02X>", b25[0]);
System.out.printf("\n0x4E in hex : <0x%02X>", b4E[0]);

String stringB25 = new String(b25, "Cp500");
String stringB4E = new String(b4E, "Cp500");

System.out.printf("\nOther way, 0x25 in hex : <0x%02X>", stringB25.getBytes("Cp500")[0]);
System.out.printf("\nOther way, 0x4E in hex : <0x%02X>", stringB4E.getBytes("Cp500")[0]);

Output :

0x25 in hex : <0x25>
0x4E in hex : <0x4E>
Other way, 0x25 in hex : <0x15>
Other way, 0x4E in hex : <0x4E>

为了理解这种行为，我研究了IBM500.java http://grepcode.com/file/repository.grepcode.com/java/root/jdk/openjdk/6-b27/sun/nio/cs/ext/IBM500.java类，我看到 0x15 和 0x25 字符maps到“\n”字符。

这背后的原因是什么？

最终，有没有办法保持字符串编码和解码之间的字节输入一致性机制?

考虑这段代码：

  public static void main(String[] args) {
    transcode();
    System.setProperty("ibm.swapLF", "true");
    transcode();
  }

  private static void transcode() {
    byte EBCDIC_NL = 0x15; //next line
    byte EBCDIC_LF = 0x25; //line feed
    byte EBCDIC_CR = 0x0D; //carriage return

    ebcdicToUtf16(EBCDIC_NL);
    ebcdicToUtf16(EBCDIC_LF);
    ebcdicToUtf16(EBCDIC_CR);

    utf16ToEbcdic("\u0085"); //next line
    utf16ToEbcdic("\n"); //line feed
    utf16ToEbcdic("\r"); //carriage return
  }

  private static void ebcdicToUtf16(byte... b) {
    String utf16 = new String(b, Charset.forName("IBM500"));
    System.out.format("%02x -> %04x%n", b[0] & 0xFF, utf16.charAt(0) & 0xFFFF);
  }

  private static void utf16ToEbcdic(String s) {
    byte[] b = s.getBytes(Charset.forName("IBM500"));
    System.out.format("%04x -> %02x%n", s.charAt(0) & 0xFFFF, b[0] & 0xFF);
  }

当在 IBM JVM (1.7) 上运行时，将发出：

15 -> 000a
25 -> 000a
0d -> 000d
0085 -> 15
000a -> 15
000d -> 0d
15 -> 000a
25 -> 000a
0d -> 000d
0085 -> 15
000a -> 25
000d -> 0d

此 IBM JVM 补丁 SI23602 http://www-01.ibm.com/support/docview.wss?uid=nas36a46c090c815e0078625716c00528125解释：

其他背景：行业中有两个标准换行函数的 EBCDIC 处理。这两个标准分别用于 LF (0x25) CDRA 或 NL (0x15) MVS 开放版。早期版本 Java（直到 JDK 1.3）在换行符的使用上不一致使用 0x15 与大多数 EBCDIC 编码兼容，而其他一些编码使用了0x25。从 JDK 1.4 开始，IBM JDK 选择对使用 NL (0x15) 的所有 EBCDIC 字符编码进行标准化。

为了解决换行函数使用的双重标准，这 APAR 将提供一个开关，允许某些 EBCDIC 转换器交换使用 0x15 或 0x25 作为换行函数。默认所有 EBCDIC 字符编码的行为仍将映射 unicode \u000A 字符到 EBCDIC 0x15 字符。指定 java属性"ibm.swapLF=true"会导致转换器切换其 unicode \u000A 到 EBCDIC 0x25 的映射。转换器其中支持此 java 属性作为开关的有：Cp284、Cp285、Cp500、 Cp1140、Cp1141、Cp1142、Cp1143、Cp1144、Cp1145、Cp1146、Cp1147、 Cp1148、Cp1149。

这两种设置都不会将任何内容映射到 U+0085（为 NL/NEL 指定 Unicode 值 http://www.unicode.org/Public/UNIDATA/UnicodeData.txt）。大概这是出于历史原因 - ASCII 没有 NEL 字符，并且 EBCDIC 到 ASCII 一定是相对常见的。

实现 Unicode 编码的无损往返是可能的，但不太可能常用编码器 http://docs.oracle.com/javase/8/docs/technotes/guides/intl/encoding.doc.html会这样做。

Notes:

Sun/Oracle JVM 不会遵守ibm.swapLF系统属性。
Unicode 换行函数指南 http://www.unicode.org/reports/tr13/不解释 NL 到 LF 映射，但提供其他信息

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Cp500 编码陌生事物（LF 和 NEL）的相关文章

从文本文件中读取阿拉伯字符

我完成了一个项目在该项目中我读取了用记事本编写的文本文件我的文本文件中的字符是阿拉伯语文件编码类型是UTF 8 当在 Netbeans 7 0 1 中启动我的项目时一切似乎都正常但是当我将项目构建为 jar 文件时字符以这种方式
将构造函数作为参数传递给方法

我是java新手开始研究构造函数我看到一些构造函数作为参数传递给方法的示例请告诉我当构造函数作为参数传递给方法时会发生什么或者建议我一些链接我可以在其中获得有关使用构造函数的足够知识根据您需要传递构造函数的目的您可以考虑传递供
将 MouseListener 添加到面板

我正在尝试将鼠标操作添加到我的面板中这就是程序应该做的事情编写一个程序允许用户通过按三下鼠标来指定一个三角形第一次按下鼠标后画一个小点第二次按下鼠标后绘制一条连接前两个点的线第三次按下鼠标后绘制整个三角形第四次按下鼠标会
在 Java 中使用 Batik 检查和删除 SVG 中的属性

这个问题基本上说明了一切如何检查 SVG 是否具有 viewBox 属性我正在使用蜡染库我需要这个因为我需要至少通知用户有一个 viewBox 属性我可以删除它吗使用 org w3c dom 类您可以按照以下方式做一些事情
如何在url请求中发送数组

我的要求如下我想给出演员姓名开始日期结束日期并获取他在该时期出演的所有电影因此我的服务请求是这样的 http localhost 8080 MovieDB GetJson name Actor startDate 20120101
如何作为应用程序发布到页面？

所以我有一个应用程序 Facebook 应用程序实体并且我有一个页面我想使用应用程序通过java代码通过restfb或任何其他建议发布到页面看起来我错过了页面授予应用程序发布权限的阶段不知道该怎么做谢谢你们乌里您只能作
无法访问“不安全”java方法的java表达式语言

我正在开发一个项目让用户向服务器提交小脚本然后我将执行这些脚本有很多脚本语言可以嵌入到Java程序中例如mvel ognl uel clojure rhino javascript等但是据我所知它们都允许脚本编写者调用Jav
如何在 MSSQL 中获取 CURRENT_DATE？

我正在使用 jpa 3 o 和 Hibernate 我有一个命名查询 SELECT COUNT wt id FROM WPSTransaction wt WHERE wt createdDate gt CURRENT DATE WPSTra
在java中将字符串日期转换为美国格式

我有下面的代码其中日期为字符串类型我必须将其设置为美国格式所以下面我已经展示了它 private static final SimpleDateFormat usOutputDate new SimpleDateFormat MM d
无法从资源加载图片

So I am trying to load a image file from a resource so that when I export my application into a jar file it could be use
在grails控制器中识别ajax请求或浏览器请求

我正在开发一个使用大量ajax的grails应用程序如果请求是ajax调用那么它应该给出响应这部分正在工作但是如果我在浏览器中输入URL 它应该带我到主页索引页面而不是请求的页面下面是ajax调用的示例gsp代码
具有 JPA 持久性的 Spring 状态机 - 存储库使用

我试图弄清楚如何轻松使用 Spring 状态机包括使用 JPA 进行持久化这是我正在处理的问题不兼容的数据类型工厂和持久性在程序的某个时刻我想使用连接到用户的状态机有用于此目的的存储库项目spring statemachin
Struts 1 到 Spring 迁移 - 策略

我有一个legacy银行应用程序编码为Struts 1 JSP现在的要求是迁移后端目前为 MVC to Springboot MVC 后续UI JSP 将迁移到angular Caveats 1 后端不是无状态的 2 会话对象中存储了大量
插入时的 iBatis 判别器

我有一个抽象类Example以及与之相伴的具体子类我使用鉴别器来提取数据out数据库的像这样
纱线上的火花，连接到资源管理器 /0.0.0.0:8032

我正在我的开发机器 Mac 上编写 Spark 程序 hadoop的版本是2 6 spark的版本是1 6 2 hadoop集群有3个节点当然都在linux机器上我在idea IDE中以spark独立模式运行spark程序它运行成功
Android：ANT 构建失败，并显示 google-play-services-lib：“解析为没有项目的 project.properties 文件的路径”

我正在尝试使用 ANT 构建我的应用程序但在包含 google play services lib 库项目后我惨遭失败 Step 1 我在 project properties 文件中设置了对库项目的引用 android library
javax.media.jai 类的公共下载？

这是一个非常简单的问题我一直在寻找可以下载 javax media jai 库的地方我找到了 jai imageio 库但是我发现的所有其他 jai 内容要么已经过时 2008 年及之前然后我遇到了登录屏幕是否有 javax me
Collections.sort(list) 和 list.sort(Comparator) 之间的区别

有什么理由让我应该选择Collections sort list 方法而不是简单地调用list sort 内部Collections sort只是调用sort的方法List无论如何上课令人惊讶的是几乎每个人都告诉我使用Collectio
spring data jpa复合键重复键记录插入导致更新

我有一个具有复合键的实体我试图通过使用 spring data jpa 存储库到 mysql 数据库来持久化它如下所示 Embeddable public class MobileVerificationKey implements S
mybatis：使用带有 XML 配置的映射器接口作为全局参数

我喜欢使用 XML 表示法来指定全局参数例如连接字符串我也喜欢 Mapper 注释当我尝试将两者结合起来时我得到这个例外 https stackoverflow com questions 4263832 type interfac

随机推荐

主题消息可以在activemq中持久化吗？

我对 JMS 和 ESB 非常陌生我使用 activemq 作为 JMS 使用 mule 作为 ESB 当我将消息从一个队列转发到另一个队列时 jms 连接器参数 persistentDelivery 为 true 它会在 activem
将部分 Activity/Fragment 保存为图像

我试图保存我的活动的一部分没有工具栏和状态栏我现在拥有的代码可以保存整个屏幕请参考下图我现在拥有的代码 llIDCardRootView LinearLayout view findViewById R id ll id card
Laravel psr-4 不自动加载

我有一个在本地运行良好的 Laravel 项目 Mavericks 但 psr 4 下的类未加载到我们的阶段服务器 CentOS 上每次尝试作曲家更新或运行 artisan 命令时我都会收到反射未找到类错误我所有的应用程序特定类都
无法将 IBOutlet 连接到 Storyboard

我最近开始使用故事板为我的 iPad 应用程序创建 iPhone 界面我已将项目更改为 Universal 而不是 iPad 并在项目摘要屏幕中将所需的故事板分配给其设备但是当我尝试使用 control drag 将任何元素连接到一段代
如何以编程方式激活“在高 dpi 设置上禁用显示缩放”[重复]

这个问题在这里已经有答案了我正在 Visual Studio 2010 上使用 C 开发 Windows 窗体应用程序我发现如果我使用高 dpi 显示设置该应用程序会缩放但是如果我通过 Windows 资源管理器上的鼠标右键单击菜
在 Visual Studio 2017 中出现未处理的异常后启用编辑

在 Visual Studio 2017 中出现未处理的异常后如何继续执行在 2015 及以下版本中可以通过单击轻松完成此操作Enable Editing它将调用堆栈展开到异常之前的点然后就可以编辑执行点变量和代码当库抛出异常时
如何使用“here-doc”将行打印到文件？

基本上这是我在过去半小时内编程和使用 Google 的结果试图实现一个简单的事情从以下位置获取用户输入 STDIN并将它们写入结构化 XML 文件作为输出下面是我丑陋的代码 bin perl print img URL img lt
Akka 流如何不断实现？

我在用阿卡流 http doc akka io docs akka stream and http experimental 1 0 scala stream index html在 Scala 中进行轮询AWS SQS https aws
在 databrick 上运行时将 PySpark 标准输出和标准错误日志保存到云对象存储

我正在标准 databricks 集群上运行 PySpark 数据管道代码我需要保存所有 Python PySpark 标准输出和标准错误消息存储到 Azure BLOB 帐户中的文件中当我在本地运行 Python 代码时我可以在终端
如何重新分发使用 Crystal Reports 的 VB 6 应用程序？

假设目标系统有 Crystal Reports for Visual Studio 2008 我如何将可执行的 VB 6 应用程序与报告文件一起分发仅移动可执行文件和报告文件是行不通的我想知道如何创建可再发行包我们使用CR10 我的建
优化子查询选择每组最后一条记录

我有这个查询它是一个依赖查询并且需要很多执行时间 SELECT u id u user name ifnull select longitude from map where user id u id order by map id de
Django QuerySet 不返回任何内容

我有一个国家地区列表例如它们都有自己的网址 www example com al 每个国家地区都有一个城市列表但 object list 为空 My View class CityOverview generic ListView
如何使嵌入式视图控制器成为响应者链的一部分？

我正在使用情节提要开发 Mac 应用程序我有一个窗口显示NSViewController作为其内容其中包含一个容器视图控制器其中嵌入了NSSplitViewController 预期的行为是NSSplitViewController
无法使用 sqldf 对 R 中的函数使用rank()

arm lt as data frame matrix c 1 1 1 2 2 6 7 4 9 10 ncol 2 colnames arm lt c a b 这是我在 R 中创建的数据集现在我想对 b 列进行排名并按 a 列进行分组无
不允许使用默认特殊成员函数的多个版本 (MSVC)

这是有效的 C 代码吗 struct S S S const default S S default Context 我尝试通过将这两行添加到以下代码中来处理歧义S godbolt https godbolt org z j9znrY6ef
使用多个视图以编程/动态方式创建 LinearLayout

我有一个像这样的层次结构 LinearLayout horizontal 图像视图 LinearLayout vertical TextView TextView TextView TextView 我希望能够通过迭代添加上面的层次结构只
对象的属性（预期为邮件项）生成“438”运行时错误：“对象不支持此属性或方法”

我试图选择一个文件夹然后显示一个 MsgBox 其中包含该文件夹及其所有子文件夹中在设定时间范围内发送的电子邮件数量我可以选择一个文件夹但我得到 438 运行时错误对象不支持此属性或方法在 for 循环之后的行上 receive
Biopython：如何避免蛋白质中的特定氨基酸序列以绘制 Ramachandran 图？

我编写了一个 python 脚本来绘制泛素蛋白的 Ramachandran 图我正在使用biopython 我正在处理 pdb 文件我的脚本如下 import Bio PDB import numpy as np import matp
使用嵌套面板

尝试为我的游戏构建一个 GUI 但无论我使用什么布局我都无法让面板嵌套来做我喜欢的事情我的目标是这个http i182 photobucket com albums x202 NekoLLX CharGenmockup 1 jpg ht
使用 Cp500 编码陌生事物（LF 和 NEL）

最近在从字节转换为字符串然后再从字符串转换为字节的过程中我遇到了 Cp500 EBCDIC 编码的奇怪问题问题在于一个特定的角色就是在这个转变过程中被转变为这个角色下面的代码验证了这一点 byte b25 0x25 byte b

使用 Cp500 编码陌生事物（LF 和 NEL）

使用 Cp500 编码陌生事物（LF 和 NEL） 的相关文章

随机推荐

热门标签

使用 Cp500 编码陌生事物（LF 和 NEL）的相关文章