Java编程中出现乱码的原因

2023-11-12

乱码的原因

理解了编码，我们来看乱码。乱码有两种常见原因：一种比较简单，就是简单的解析错误；另外一种比较复杂，在错误解析的基础上进行了编码转换。我们分别介绍。

1.解析错误

看个简单的例子。一个法国人采用Windows-1252编码写了个文件，发送给了一个中国人，中国人使用GB18030来解析这个字符，看到的可能就是乱码。比如，法国人发送的是Pékin，Windows-1252的二进制（采用十六进制）是50E96B 696E，第二个字节E9对应é，其他都是ASCII码，中国人收到的也是这个二进制，但是他把它看成了GB18030编码，GB18030中E96B对应的是字符“閗”，于是他看到的就是“P閗in”，这看来就是一个乱码。

反之也是一样的，一个GB18030编码的文件如果被看作Windows-1252也是乱码。

这种情况下，之所以看起来是乱码，是因为看待或者说解析数据的方式错了。只要使用正确的编码方式进行解读就可以纠正了。很多文件编辑器，如EditPlus、NotePad++、UltraEdit都有切换查看编码方式的功能，浏览器也都有切换查看编码方式的功能，如Fire-fox，在菜单“查看”→“文字编码”中即可找到该功能。

切换查看编码的方式并没有改变数据的二进制本身，而只是改变了解析数据的方式，从而改变了数据看起来的样子，这与前面提到的编码转换正好相反。很多时候，做这样一个编码查看方式的切换就可以解决乱码的问题，但有的时候这样是不够的。

2.错误的解析和编码转换

如果怎么改变查看方式都不对，那很有可能就不仅仅是解析二进制的方式不对，而是文本在错误解析的基础上还进行了编码转换。我们举个例子来说明：

1）两个字“老马”，本来的编码格式是GB18030，编码（十六进制）是C0CF C2ED。

2）这个二进制形式被错误当成了Windows-1252编码，解读成了字符“ÀÏÂí”。

3）随后这个字符进行了编码转换，转换成了UTF-8编码，形式还是“ ÀÏÂí”，但二进制变成了C380C38F C382C3AD，每个字符两个字节。

4）这个时候再按照GB18030解析，字符就变成了乱码形式“脌脧脗铆”，而且这时无论怎么切换查看编码的方式，这个二进制看起来都是乱码。

这种情况是乱码产生的主要原因。

https://www.bilibili.com/video/BV16G4y1Q7Ub/?spm_id_from=333.999.0.0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

Powered by 金山文档

Java编程中出现乱码的原因的相关文章

菜单未显示在应用程序中

由于某种原因我的操作菜单在我的 Android Studio 应用程序中消失了我正在按照教程学习如何创建 Android 应用程序但最终遇到了这个问题我正在使用 atm 的教程 http www raywenderlich com
如何在日期选择器中设置不在当前月份的单元格的样式

我目前正在为我的 JavaFX 应用程序制作注册表问题是当日期选择器中的单元格不在页面的月份上时我想让该单元格变灰让我们看看我当前的日期选择器我的日期选择器正如您所看到的我希望下个月的日期 27 日 28 日 30 日以及 1
热重载在docker中运行的java程序

我开发了一个java程序应该在docker中运行然而我在调试docker中运行的java程序时遇到了很多痛苦我在网上搜索一些教程提出了像 spring dev tools 这样的工具因为我的java程序是基于spring boo
Java 中的 XPath 节点集

我在 eclipse 中有这段代码 NodeSet nodes NodeSet xPath evaluate expression inputSource XPathConstants NODESET 它给我 NodeSet 上的编译时错误
ElasticBeanstalk Java，Spring 活动配置文件

我正在尝试通过 AWS ElasticBeanstalk 启动 spring boot jar 一切正常配置文件为默认有谁知道如何为 java ElasticBeanstalk 应用程序不是 tomcat 设置活动配置文件 spri
manifest.mf 文件的附加内容的约定？

Java JAR 中的 MANIFEST MF 文件是否有任何超出 MANIFEST MF 约定的约定 JAR规范 http download oracle com javase 1 4 2 docs guide jar jar html
Java8无符号算术

据广泛报道 Java 8 具有对无符号整数的库支持然而似乎没有文章解释如何使用它以及有多少可能有些函数例如 Integer CompareUnsigned 很容易找到并且似乎可以实现人们所期望的功能但是我什至无法编写一个简单的
Convert.FromBase64String 方法的 Java 等效项

Java 中是否有相当于Convert FromBase64String http msdn microsoft com en us library system convert frombase64string aspx which 将指
Clip 在 Java 中播放 WAV 文件时出现严重延迟

我编写了一段代码来读取 WAV 文件大小约为 80 mb 并播放该文件问题是声音播放效果很差极度滞后你能告诉我有什么问题吗这是我的代码我称之为doPlayJframe 构造函数内的函数 private void doPlay f
Java中接口作为方法参数

前几天去面试被问到了这样的问题问反转链表给出以下代码 public class ReverseList interface NodeList int getItem NodeList nextNode void reverse No
Spring Data 与 Spring Data JPA 与 JdbcTemplate

我有信心Spring Data and Spring Data JPA指的是相同的但后来我在 youtube 上观看了一个关于他正在使用JdbcTemplate在那篇教程中所以我在那里感到困惑我想澄清一下两者之间有什么区别Spring
尝试使用 Ruby Java Bridge (RJB) gem 时出现错误“无法创建 Java VM”

我正在尝试实现 Ruby Java Bridge RJB gem 来与 JVM 通信以便我可以运行 Open NLP gem 我在 Windows 8 上安装并运行了 Java 所有迹象至少我所知道的都表明 Java 已安装并可运行
Java直接内存：在自定义类中使用sun.misc.Cleaner

在 Java 中 NIO 直接缓冲区分配的内存通过以下方式释放 sun misc Cleaner实例一些比对象终结更有效的特殊幻像引用这种清洁器机制是否仅针对直接缓冲区子类硬编码在 JVM 中或者是否也可以在自定义组件中使用清洁器例
org.jdesktop.application 包不存在

几天以来我一直在构建一个 Java 桌面应用程序一切都很顺利但是今天当我打开Netbeans并编译文件时出现以下编译错误 Compiling 9 source files to C Documents and Settings Ad
Java中未绑定通配符泛型的用途和要点是什么？

我不明白未绑定通配符泛型有什么用具有上限的绑定通配符泛型 stuff for Object item stuff System out println item Since PrintStream println 可以处理所有引用类型通
使用 SAX 进行 XML 解析 |如何处理特殊字符？

我们有一个 JAVA 应用程序可以从 SAP 系统中提取数据解析数据并呈现给用户使用 SAP JCo 连接器提取数据最近我们抛出了一个异常 org xml sax SAXParseException 字符引用是无效的 XML 字符
Windows 上的 Nifi 命令

在我当前的项目中我一直在Windows操作系统上使用apache nifi 我已经提取了nifi 0 7 0 bin zip文件输入C 现在当我跑步时 bin run nifi bat as 管理员我在命令行上看到以下消息但无法运行
Android JNI C 简单追加函数

我想制作一个简单的函数返回两个字符串的值基本上 java public native String getAppendedString String name c jstring Java com example hellojni He
如何配置eclipse以保持这种代码格式？

以下代码来自 playframework 2 0 的示例 Display the dashboard public static Result index return ok dashboard render Project findInv
JAVA - 如何从扫描仪读取文件中检测到“\n”字符

第一次海报我在读取文本文件的扫描仪中读取返回字符时遇到问题正在读取的文本文件如下所示 test txt start 2 0 30 30 1 1 90 30 0 test txt end 第一行 2 表示两个点第二行位置索引 0 xp

随机推荐

攻防世界————fileclude（内含php伪协议菜鸟讲解）

先进去发现为一坨php代码新手勉勉强强看得懂接下来我们分析代码 WRONG WAY
Angular2-使用Augury来调试Angular2程序

原文链接 http www jianshu com p efecaea287f2 推荐 Augury Angular专用的chrome 调试插件如题就在前几天的2016 12 8谷歌开发者大会上 angular2的leader来给我们演
idea字体主题集合

http color themes com view index
意念控制四旋翼学习笔记

第一部分模块原始数据拿到模块在网上查了一圈发现基本没什么有用的资料很多都是一些相关但是没有实际价值的东西许多论文都是再谈怎么去做而没有实实在在的去完成这么一个过程废话不多说直接步入正题昨天在网上才发现这个软件据评论说是
最近大火的「元宇宙」是什么？

公众号后台回复图书了解更多号主新书内容作者腾讯技术工程特约撰稿人李佳华本文将介绍元宇宙的由来和底层技术探讨海内外资本在这条赛道上的布局元宇宙将会对哪些行业产生变革的影响这些影响背后凸显了元宇宙的哪些价值以及元宇宙逐步实现
openwrt reboot流程

openwrt 系统中当执行了 reboot 命令系统将会发生什么事情呢如何进行重启的呢下面来一起看一下 reboot 应用层操作首先 reboot 是由busybox 它是一个集成了常用Linux命令和工具的软件提供的一个Li
leetcode算法面试题：串联所有单词的子串问题、单词拆分问题

串联所有单词的子串问题给定一个字符串 s 和一些长度相同的单词 words 找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置注意子串要与 words 中的单词完全匹配中间不能有其他字符但不需要考虑 word
数据挖掘算法基础-关联规则

数据挖掘中被常拿来说的啤酒尿布的例子就是一个很典型的运用关联算法来做购物来分析的例子常被用于交易数据关系数据的分析发现数据集中隐藏的频繁模式这些频繁模式可以用关联规则的形式表示有效的关联规则对商家的商品进出货摆放都有很大的指导意
直方图均衡化与直方图规定化

一认识图像当我们面对图像的时候我们面对的是抽象的矩阵如下图下面是0 255的灰度图像的表示密密麻麻的那么我们做的直方图其实就是对这些像素值的统计如下图所示其中Bin表示条数数据和范围是对图的解释二为什么要做直方图均
qt 嵌入web页面_Qt -在应用程序中嵌入Web内容之环境搭建

一 Qt应用程序与Web结合的发展 1 从Qt5 5开始 Qt WebKit模块被废弃了取而代之的是Qt WebEngine模块当时可以使用该模块将应用程序与Web技术结合 2 Qt WebEngine模块提供了一个Web浏览器引擎可
ChatGPT：概述Vue.js中data函数初始化和created钩子函数调用的顺序和问题解决方法

ChatGPT 概述Vue js中data函数初始化和created钩子函数调用的顺序和问题解决方法我将输入一段Vue代码请你记住 created console log this queryInfo this getClueList
Libuv源码分析 —— 6. 事件循环【uv_run】

通过之前的学习咱们已经明白了在事件循环中的三个核心内容分别是 Libuv源码分析定时器 Libuv源码分析 idle prepare check Libuv源码分析 poll io 现在让咱们从头捋一遍事件循环到底完成了什么功能呢 u
scrapy里面的response.xpath(“用xpath插件找打的路径“)返回值为空?

response xpath 用xpath插件找打的路径返回值为空 1 可能是因为路径是有问题的 2 可能是start urls的路径是有问题的可以从network中找找路径复制一下
使用vant2问题整理

1 export createVNode imported as createVNode was not found in vue possible exports EffectScope computed customRef defaul
C++11移动语义解析

当给函数传递对象当做函数参数时可以使用引用类型来减少拷贝对象的代价尤其是避免容器的拷贝等但是当把函数内的局部对象当做返回值时我们无法返回该局部对象的引用导致每次返回局部对象都会进行拷贝因为返回局部对象的引用是无意义的当函数调用
编译原理实验日志

编译原理生成四元式实验原理构造SLR 1 分析表调试过程实验原理构造SLR 1 分析表首先求得follow集 follow E follow T follow F 画出DFA状态转换图调试过程没有判断因为字符串中没有表示
dubbo优雅停机

dubbo优雅停机 Dubbo是通过JDK的ShutdownHook来完成优雅停机的所以如果用户使用 kill 9 PID 等强制关闭指令是不会执行优雅停机的只有通过 kill PID 时才会执行原理服务提供方停止时先标记为
grafana与prometheus实现监控可视化

1 Grafana基础知识 Grafana是一个开源的指标监测和可视化工具官方网站为 Grafana The open observability platform Grafana Labs 常用于展示基础设施的时序数据和应用程序运行分析
大话设计模式9—观察者模式（通知者与观察者）

大话设计模式9 观察者模式老板回来我不知道 1 需求老板回来我不知道 2 双向耦合的设计 2 1 前台秘书类 2 2 看股票同事类 2 3main函数及输出 3 解耦修改 3 1 抽象观察者类 3 2 前台秘书类 3 3 main函
Java编程中出现乱码的原因

乱码的原因理解了编码我们来看乱码乱码有两种常见原因一种比较简单就是简单的解析错误另外一种比较复杂在错误解析的基础上进行了编码转换我们分别介绍 1 解析错误看个简单的例子一个法国人采用Windows 1252编码写了个文件

Java编程中出现乱码的原因

Java编程中出现乱码的原因 的相关文章

随机推荐

热门标签

Java编程中出现乱码的原因的相关文章