为什么 Java 生态系统在整个软件堆栈中使用不同的字符编码？

2024-02-13

例如，类文件使用 CESU-8（有时也称为 MUTF-8），但 Java 内部首先使用 UCS-2，现在使用 UTF-16。关于有效 Java 源文件的规范规定，最小符合标准的 Java 编译器只需接受 ASCII 字符。

这些选择的原因是什么？在整个 Java 生态系统中使用相同的编码不是更有意义吗？

源文件使用 ASCII 是因为当时人们认为期望人们拥有完全支持 Unicode 的文本编辑器是不合理的。此后情况有所改善，但仍然不完美。整体\uXXXXJave 中的 thing 本质上是 Java 中 C 的三字母的等价物。（当创建 C 时，某些键盘没有大括号，因此您必须使用三字母！）

在创建 Java 时，类文件格式使用 UTF-8，运行时使用 UCS-2。 Unicode 的代码点少于 64k，因此 16 位就足够了。后来，当额外的“平面”被添加到 Unicode 中时，UCS-2 被（几乎）兼容的 UTF-16 取代，UTF-8 被 CESU-8 取代（因此“兼容性编码方案...”）。

在类文件格式中，他们希望使用 UTF-8 来节省空间。类文件格式（包括 JVM 指令集）的设计非常注重紧凑性。

在运行时，他们希望使用 UCS-2，因为他们认为节省空间比避免处理可变宽度字符更重要。不幸的是，现在它是 UTF-16，这种事与愿违，因为一个代码点现在可以采用多个“字符”，更糟糕的是，“char”数据类型现在有点错误命名（一般来说，它不再对应于一个字符，但是相反，对应于 UTF-16 代码单元）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 Java 生态系统在整个软件堆栈中使用不同的字符编码？的相关文章

在 Java 正则表达式中获取多个模式的重叠匹配

我有同样的问题这个链接 https stackoverflow com questions 18751486 matching one string multiple times using regex in java 但有多种模式我的正
对象数组的数组（二维数组）JNI

我正在努力创建自定义对象类型 ShareStruct 的二维数组 jobjectArray ret jobjectArray ins jobjectArray outs jclass myClass env gt FindClass env
从 Spring MVC XML 文件转移到 javaconfig。我真的对我的数据库 XML 文件感到困惑

我从 Spring MVC XML 文件转移到 javaconfig 我真的对我的数据库 XML 文件感到困惑我不知道如何让 Hibernate4 工作以及我的 JBoss JNDI 数据源工作有人可以告诉我如何使 javaconfig
重写 getPreferredSize() 会破坏 LSP

我总是在这个压倒一切的网站上看到建议getPreferredSize 而不是使用setPreferredSize 例如如前面的线程所示对于固定大小的组件使用重写 getPreferredSize 而不是使用 setPreferredS
无法访问“不安全”java方法的java表达式语言

我正在开发一个项目让用户向服务器提交小脚本然后我将执行这些脚本有很多脚本语言可以嵌入到Java程序中例如mvel ognl uel clojure rhino javascript等但是据我所知它们都允许脚本编写者调用Jav
记录共享和映射的诊断上下文

据我所知其他人做了什么来解决 Commons Logging 项目针对 NET 和 Java 不支持映射或嵌套诊断上下文这一事实执行摘要我们选择直接使用实现者日志框架在我们的例子中为 log4j 长答案您是否需要一个抽象日志框架
以有效的方式从 Map 中删除多个键？

我有一个Map
在grails控制器中识别ajax请求或浏览器请求

我正在开发一个使用大量ajax的grails应用程序如果请求是ajax调用那么它应该给出响应这部分正在工作但是如果我在浏览器中输入URL 它应该带我到主页索引页面而不是请求的页面下面是ajax调用的示例gsp代码
验证假名输入

我正在开发一个允许用户输入日语字符的应用程序我试图想出一种方法来确定用户的输入是否是日语假名平假名片假名或汉字应用程序中的某些字段不适合输入拉丁文文本我需要一种方法将某些字段限制为仅限汉字或仅限片假名等该项目使用UTF 8编码
嵌套字段的 Comparator.comparing(...)

假设我有一个这样的域模型 class Lecture Course course getters class Course Teacher teacher int studentSize getters class Teacher int
如何在不反编译的情况下更改已编译的.class文件？

我想更改 class 文件方法我安装 JD Eclipse Decompiler 并打开 class 文件我添加了一些代码并保存 class 文件但是 class 文件没有改变我不知道如何使用反编译器如果可能的话如何在不使用反编
Java 中 JButton 的击键/热键

最初我使用 JMenu 并建立热键以使用加速器工作它运行得很好现在我想在 JButton 中实现相同的行为但我陷入困境这是我编写的代码请分享您的想法以便我可以走上正确的道路 import javax swing import j
如何减去两个 XmlGregorianCalendar 对象来创建一个 Duration 对象？

我想计算两个时间之间的差值XmlGregorianCalendar对象从而创建一个Duration object 但我还没有找到执行减法的干净方法你会怎么做那应该是 DatatypeFactory newDuration xgc2 t
java中使用多线程调用同一类的不同方法

我有一个类如下所示具有三种方法 public class MyRunnable implements Runnable Override public void run what code need to write here to c
使用 PC/SC 读卡器验证 Ultralight EV1

我在尝试使用 Java 中的 PC SC 读卡器特别是 ACR1222L 验证 Ultralight EV1 卡时遇到问题我能够使用 ISO 14443 3 标签的相应 APDU 在不受保护的标签上进行写入和读取但是我找不到运行 P
如何制作一个makefile只用于编译一些java文件？

我有三个java文件名为A java B java C java A将创建对象B B将创建对象C 但我以前从未构建过makefile 有谁可以帮我构建一个 makefile 来编译这三个 java 文件吗我应该使用什么工具来制作 mak
Axis2 错误：要输出的文本中的空白字符 (0x4) 无效

我创建了一个 Java 客户端使用 Axis2 1 7 6 作为代码生成器与 SOAP Web 服务进行交互问题在于客户端的某些输入抛出异常并显示以下消息 org apache axis2 AxisFault Invalid white
为什么java.lang.Cloneable不重写java.lang.Object中的clone()方法？

Java 规范java lang Cloneable接口将自身定义为表示扩展它的任何对象也实现了clone 休眠的方法java lang Object 具体来说它说一个类实现了Cloneable接口来指示java lang Object
如何建立与 FileZilla Server 1.2.0 的 FTPS 数据连接

使用 Apache commons net 的 Java FTPSClient 进行会话恢复是一个已知问题会话恢复是 FTPS 服务器数据连接所需的一项安全功能 Apache FTPSClient 不支持会话恢复并且 JDK API 使
Errors/BindingResult 参数应在模型属性、@RequestBody 或 @RequestPart 参数之后立即声明

我通过剖析示例应用程序来自学 Spring 然后到处添加代码来测试我在剖析过程中开发的理论在测试添加到 Spring 应用程序中的一些代码时我收到以下错误消息 An Errors BindingResult argument is ex

随机推荐

链接元素加载

无论如何有没有办法监听 onload 事件元素 F ex var link document createElement link link rel stylesheet link href styles css link onload
如何使用 python 打开 adb shell 并在 shell 内执行命令

我正在尝试使用 subprocess Popen 在 python 中执行 adb shell 命令示例需要在 adb shell 中执行命令手动执行时我打开命令窗口并按如下所示执行它可以工作 gt adb shell
如果芹菜工人死了，工作会重试吗？

如果运行工作程序的服务器挂掉是否有办法重试 celery 作业我指的不仅仅是执行作业的子进程而是整个服务器变得不可用我尝试使用 RabbitMQ 和 Redis 作为代理在这两种情况下如果当前正在处理作业则它会被完全遗忘当工
当键盘出现时 ActionBar 隐藏

我正在使用 ActionBarSherlock windowSoftInputMode is adjustPan 我尝试过adjustResize and adjustNothing also 我想保留ActionBar当键盘出现时屏幕上b
从 Laravel 查询生成器生成原始 MySQL 查询

我怎样才能得到mysql查询一个laravel query Convert App User where balance gt 0 gt where gt get To SELECT FROM users WHERE balance gt
从 CoffeeScript 文件调用 JavaScript 函数

我需要在我的 CoffeeScript 应用程序中使用 JavaScript 库由于我对两种语言都不熟悉所以我尝试一些简单的方法我的咖啡脚本文件 empty require models empty class Contact ext
glGenTextures - 纹理的数量有限制吗？

在 OpenGL 中即使用 glGenTextures 可以创建的纹理数量是否有限制我知道 GL 施加了一些限制例如片段着色器中可以使用的纹理数量但是我无法找到任何有关可用的整数纹理名称总数的文档 glGenTextures
基本 Javascript 数学文本字段

你好我是新人正在学习 javascript 我正在尝试通过文本字段制作一个加法程序检查js fiddle上的html代码http jsfiddle net fCXMt http jsfiddle net fCXMt 我需要知道的是如何
突出显示 PHP 中两个字符串之间的差异

在 PHP 中突出显示两个字符串之间的差异的最简单方法是什么我正在沿着 Stack Overflow 编辑历史页面的思路思考其中新文本为绿色删除的文本为红色如果有任何预先编写的函数或类可用那将是理想的只是编写了一个类来计算将一个
将 QTableWidget 写入 .csv 或 .xls

是否可以将 QTableWidget 的内容写入 csv 我发现了一个关于使用 xlwt 写入 xls 的问题但似乎无法使用我的代码使其工作 def saveFile self filename unicode QtGui QFileDi
从管理员权限应用程序读取 cpu 控制寄存器的值 (Windows)

我正在尝试使用内联汇编从 cpu 控制寄存器读取数据我最初的目标是 x86 64 我对 c 或汇编不太熟悉但我设法进行了一个非常简单的尝试如下所示 include
更新 Gradle 和构建工具后 Android JAVA 字节代码丢失

我正在使用 Jacoco 创建覆盖率报告并且在更新 Gradle 和 BuildTools 版本之前工作正常然后我恢复这些更改并再次工作雅可可寻找 class文件在这里 buildDir intermediates classes d
C语言中如何显示某些变量的起始地址？

include
log4j2：设置异步日志记录 Log4jContextSelector 系统属性的位置

我正在尝试在当前在 liberty 配置文件服务器中运行的 REST Web 方法中设置异步日志记录出于性能原因为了做到这一点我设置了以下属性 System setProperty Log4jContextSelector org a
清理使用自定义弱指针的一对多关系中的 nullptr

我有一个一对多的地图类 MyMap1N
为什么通用 NSDictionary 不会警告我输入错误的键插入/分配？

为什么不做下面的NSDictionary NSMutableDictionary调用会产生错误或警告吗我预计这里会出现错误因为 rhsNSDictionary文字与泛型类型不匹配NSDictionarylhs 局部变量 NSDictio
如何使用 FuncAnimation 和 blit=True 为 Poly3DCollection 制作动画？

我正在尝试为旋转立方体制作动画为此我使用 Poly3DCollection 并使用 FuncAnimation 对其进行动画处理 anim animation FuncAnimation fig visualize rotation f
python cx_冷冻鸡蛋问题

我试图从Python脚本使用大量鸡蛋构建一个可执行文件适用于32位Windows XP 我考虑过 py2exe 0 6 9 PyInstaller 1 4 和 cx Freeze 4 1 2 py2exe 不喜欢早餐吃鸡蛋 http
Telegram 机器人：示例 json、inline_keyboard

在电报机器人中显示 inline keyboard 的示例 json https core telegram org bots inline keyboards and on the fly updating https core tele
为什么 Java 生态系统在整个软件堆栈中使用不同的字符编码？

例如类文件使用 CESU 8 有时也称为 MUTF 8 但 Java 内部首先使用 UCS 2 现在使用 UTF 16 关于有效 Java 源文件的规范规定最小符合标准的 Java 编译器只需接受 ASCII 字符这些选择的原因是什么

为什么 Java 生态系统在整个软件堆栈中使用不同的字符编码？

为什么 Java 生态系统在整个软件堆栈中使用不同的字符编码？ 的相关文章

随机推荐

热门标签

为什么 Java 生态系统在整个软件堆栈中使用不同的字符编码？的相关文章