未知的 UTF-8 代码单元闭合双引号

2024-07-01

我的问题如下。我正在读取一个 XML 文件，其文本节点部分包含 UTF-8 版本的打开和关闭双引号。文本被提取、缩短为 3999 字节并放入新的 XML 格式，然后保存为文件。

虽然 Notepad++ 在输入文件中正确显示了这两个符号，但输出文件包含无效的 utf-8 字符，甚至 Notepad++ 也无法显示。

左双引号打印正确，但右双引号被破坏。

使用十六进制编辑器，我发现代码单元以某种方式从

E2 80 9D

在输入文件中

E2 80 3F

在输出文件中。我正在使用 sax-parser 进行 xml 解析。

是否有任何已知的错误可能导致这种行为？

不是已知错误，而是读取文件或写入文件时忽略编码的常见错误 - 导致使用的平台默认编码在本例中为 Windows-1252。

当您最初读取文件时，应指定 UTF-8 解码，而在写入新文件时，应指定 UTF-8 编码。如果您发布您的实现，我可以就地纠正它。

如何重现这一点：

byte[] quoteutf8 = {(byte)0xE2, (byte)0x80, (byte)0x9D};
String decodedPlatformDefault = new String(quoteutf8, "Windows-1252");
byte[] encodedPlatformDefault = decodedPlatformDefault.getBytes("Windows-1252");

for( byte i : encodedPlatformDefault ) {
    System.out.print(String.format( "%02x ", i ));
   //e2 80 3f   
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

xml

UTF8

saxparser

未知的 UTF-8 代码单元闭合双引号的相关文章

将日期从“2009-12 Dec”格式转换为“31-DEC-2009”

2009 12 Dec should be converted to 31 DEC 2009 2010 09 Sep should be converted to 30 SEP 2010 2010 02 Feb should be conv
使用 Jackson 从 JSON 文件中删除空元素

我正在尝试从 JSON 文件中删除一个元素 Lorem Ipsum 4 Lorem Ipsum 5 keyToRemove value 使用以下代码我可以删除键和值 for JsonNode personNode rootNode if
在 Maven 存储库中查找 Oracle JDBC 驱动程序

我想将 oracle jdbc 驱动程序作为依赖项运行时范围添加到我的项目中 ojdbc14 在 MVNrepository 站点中放入 POM 的依赖项是
Java可以用来写Win32系统服务吗？

标题有点概括了我正在考虑使用Jabaco http www jabaco org因为它生成 EXE 以及 jar 文件而且我对 VB 语法比对 Java 更熟悉你当然可以用Java 服务包装器 http wrapper tanukis
如何声明多个元素共有的属性？

我有多个元素想要赋予这些属性这在 DTD 中是否可行或者我必须手动完成另外当我在这里时我认为宣布margin and padding属性就是这样有谁知道更好的方法
使用 ThreadCount TestNG 限制并行测试的数量

我在这里很头疼我不知道如何处理这个问题我有几个通过 xml 运行的测试类约90个测试班每个班约10 Test进入其中我配置了一个硒网格带有maxSession 5因此单个节点上最多可以并行运行 5 个并行浏览器实例这是我不明
Spring Boot数据休息中的日期问题

当我处理日期时我遇到了春季数据休息的问题简而言之就是推迟一天的日期例如如果我有 1111 11 11 它会返回给我 1111 11 10 SO 中有一些相关的帖子 ex1 https stackoverflow com quest
FlyingSaucer renderer.setDocument 抛出“流已关闭”异常

我在使用找到的简单示例创建 PDF 时遇到问题here http today java net pub a today 2007 06 26 generating pdfs with flying saucer and itext html
使用 Jackson 反序列化非字符串映射键

我有一张如下所示的地图 public class VerbResult JsonProperty similarVerbs private Map
您使用什么来进行复杂的构建过程？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在尝试改进我们的构建过程目前它是一个巨大的 Ant build xml 它调用其他 ant 构建
从 android 将用户注册到 QuickBlox 用户

我正在尝试在我的 Android 应用程序中使用 QuickBlox 我阅读了指南并导入了示例一切正常我更改了一些用户可以使用 EditText 作为用户名和另一个密码登录的内容并且效果很好但现在我想添加一个注册按钮使用户能够注册
在 Eclipse 中默认将类设为 Final 吗？

有没有办法让 Eclipse 中的类默认为final 即在保存操作中还是在创建新类对话框中这确实是一个 hack 但是您可以在 Eclipse 设置中设置以下代码模板在 Java gt 代码样式 gt 代码模板 gt 代码 gt 新
Jersey/JAX-RS ：在响应标头中返回内容长度而不是分块传输编码

我正在使用 Jersey 创建 RESTful API 资源并且ResponseBuilder生成响应 RESTful 资源的示例代码 public class infoResource GET Path service id Produ
从 Runnable 类内部访问共享变量

我需要在主类的 main 方法中定义一个共享变量我需要两个线程才能访问该共享变量我通过实现 Runnable 接口并实现该接口的抽象 run 方法来创建线程如何从实现 Runnable 接口的类中定义的 run 方法中引用 Main
使用 X509 证书对多个收件人进行 XML 加密和解密

我已经成功地使用 MSDN 上的示例来加密和解密 xml 文档 http msdn microsoft com en us library ms229744 aspx http msdn microsoft com en us librar
Hibernate 中的枚举，作为枚举持久存在

在我的 MySQL 数据库中有一列 gender enum male female 我创建了我的枚举 com mydomain myapp enums Gender 并在我的Person实体我被定义为性别现在我想将枚举类型保留在我的
数组的浅拷贝，为什么不能简单地做newArr = oldArr？

假设我有一个整数数组 orig 我想浅复制它所以我不能这样做 int shallow orig 我的教授说对于原语浅复制和深复制本质上是相同的因为我们必须复制数组的每个索引但是将整个数组设置为等于另一个数组会起到同样的作用对吧
Java中从long到float的信息丢失[重复]

这个问题在这里已经有答案了如果你调用Java的以下方法 void processIt long a float b a do I have loss here 当我将 long 变量分配给 float 变量时是否会丢失信息 Java 语
最高效的 Java 原始集合库 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案最好的 Java 原始集合库是什么记忆力和时间效率最高我找到了 Trove 和FastUtil http fastutil di un
允许轻松打印字节码指令*包括*参数的库

我正在寻找一个图书馆easily让我查看方法的给定字节码例子 ALOAD 0 INVOKEVIRTUAL ns c m I IRETURN 我都尝试过 ASM 我实际上可以让它打印指令和参数但是我很难理解它的整个访问者范例也就是说我

随机推荐

更新主干模型/视图的轮询请求

我需要找到一种方法来更新使用以下实现的网络应用程序backbone 用例如下我有几个视图每个视图或者可能与该视图相关的模型集合需要在不同的时间向服务器发出不同的轮询请求以发现某些变化我想知道最通用的方法是什么 1 实施Tradi
通过setRequestHeader授权

我发现这段代码可以使用 setRequestheader 和 Ajax 进行身份验证 this xmlDoc setRequestHeader Authorization Basic Base64 encode User Password
Python Pandas：使用 groupby() 和 agg() 时顺序是否保留？

我经常使用熊猫 agg 函数对 data frame 的每一列运行摘要统计例如以下是生成平均值和标准差的方法 df pd DataFrame A group1 group1 group2 group2 group3 group3 B 1
如何在 kubernetes 中“部署”而不进行任何更改，只是为了让 pod 循环

我正在尝试做的事情 Pod 中运行的应用程序在启动时会刷新其数据文件每次我想刷新数据时都需要重新启动容器刷新可能需要几分钟所以我有一个探针检查准备情况 What I think是一个解决方案我将运行一个预定的工作 http kube
CVS 只读签出

我必须在项目中使用CVS 到目前为止在我的整个工作生涯中我只使用过 perforce 而且我对 CVS 一无所知我阅读了整个 CVS 手册但找不到如何执行此操作在perforce中当你签出一个文件时你首先必须执行p4 edit
C# 参数隐式转换

有这个代码 class Program static void Main string args Check 3 Console ReadLine static void Check int i Console WriteLine I am
Python中字典转小写

我希望这样做但为了一本字典 My string lower 是否有内置函数或者我应该使用循环您将需要使用循环或列表生成器理解如果你想将所有的键和值都小写你可以这样做 dict k lower v lower for k v in
为什么 Sequence 是 mypy 中 + 不支持的操作数类型？

mypy给出一个错误Sequence str 不是受支持的操作数类型操作员 test py from typing import Sequence def test x Sequence str y Sequence str gt Seq
React + Redux 中的多个/批量删除

我有一个允许多重选择和删除功能的数据网格我的 api 有一个删除端点 DELETE http localhost 8888 api audit id 这就是动作创建者 export function deleteAudit audits
使用 mqtt 协议和 kafka 作为消息代理

我们如何使用 mqtt 协议和 kafka 作为消息代理客户端 android ios 桌面 java 应用程序等将使用 mqtt phao 客户端库生成和使用消息这些客户端库可使用 kafka 作为消息代理以不同语言提供有什么建议
Python，针对频繁模式的网络日志数据挖掘

我需要开发一个用于网络日志数据挖掘的工具由于在特定用户会话中请求了许多 url 序列从 Web 应用程序日志中检索我需要找出网站用户的使用模式和组集群我是数据挖掘的新手现在经常检查谷歌发现一些有用的信息即查询似乎指向几乎完全
Electron v4 支持 ECMAScript 模块吗？

我正在使用 Electron 编写应用程序当前版本 4 0 6 基于 Node 10 11 0 和 Chrome 69 0 3947 106 我认为最新版本的 Electron 将支持 ECMAScript ES6 模块但到目前为止我还
Jenkins 管道脚本未运行

对于下面的管道脚本 Helo World 未打印甚至节点也没有被分配 pipeline agent any stages stage Example steps echo Hello World 安装了 Pipeline Declarat
为什么当缩放改变时，具有相同高度的元素“看起来”不同？

基本上要点就在主题中当我创建两个具有固定高度 2px 的相同 div 并将缩放更改为 75 或 125 时由于某种原因它们看起来不同有人可以解释一下这里发生了什么吗我该如何解决这个问题 gradient slider line
当我使用 iText 从 PDF 文件中提取文本时，我从前一页获取值

我正在尝试从多页 PDF 文件中每个页面的特定位置提取文本块我知道文本的位置并且能够在第一页上正确提取它然而在第一页之后的页面上提取的文本似乎正在累积例如如果第 1 页上的文本值为 A 第 2 页为 B 第 3 页为 C 那么
如何使用 scipy.spatial.Delaunay 查找 delaunay 三角剖分中给定点的所有邻居？

我一直在寻找这个问题的答案但找不到任何有用的东西我正在使用 python 科学计算堆栈 scipy numpy matplotlib 并且我有一组二维点我为其计算 Delaunay 训练 wiki https en wikipedia
Python 中的双 SSH 隧道

今天我在命令行中使用 ssh 将端口从远程服务器转发使用中间服务器到我的本地计算机这是我在 shell 中使用的命令 ssh user remote server L 2443 localhost 433 此 ssh 会话使用 ssh
如何将组添加到多个内置功能区选项卡 (vsto)？

这是 VS2010 Office 2010 加载项我想要的只是添加一个按钮或按钮组到多个内置选项卡例如我的按钮应该在两个中都可用新邮件消息功能区 and in 新预约丝带我尝试添加一个新选项卡在视觉设计器中但这似乎不起作用
使用本地文件作为

是否可以使用用户硬盘中的音频文件作为srcHTML5 的属性
未知的 UTF-8 代码单元闭合双引号

我的问题如下我正在读取一个 XML 文件其文本节点部分包含 UTF 8 版本的打开和关闭双引号文本被提取缩短为 3999 字节并放入新的 XML 格式然后保存为文件虽然 Notepad 在输入文件中正确显示了这两个符号但输出文

未知的 UTF-8 代码单元闭合双引号

未知的 UTF-8 代码单元闭合双引号 的相关文章

随机推荐

未知的 UTF-8 代码单元闭合双引号的相关文章