如何使用 Javascript 在浏览器中解析非 UTF8 XML？

2024-01-04

我有一个用 big5 编码的 XML 字符串：

atob('PD94bWwgdmVyc2lvbj0iMS4wIiBlbmNvZGluZz0iYmlnNSIgPz48dGl0bGU+pKSk5TwvdGl0bGU+')

(<?xml version="1.0" encoding="big5" ?><title>中文</title>以 UTF-8 格式。）

我想提取内容<title>。如何在浏览器中使用纯 Javascript 来做到这一点？最好有没有 jquery 或 emscripten 的轻量级解决方案。

试过DOMParser:

(new DOMParser()).parseFromString(atob('PD94bWwgdmVyc2lvbj0iMS4wIiBlbmNvZGluZz0iYmlnNSIgPz48dGl0bGU+pKSk5TwvdGl0bGU+'), 'text/xml')

但 Chromium 和 Firefox 都不尊重编码属性。这是一个标准吗DOMParser只支持UTF-8？

我怀疑问题不是DOMParser, but atob，它无法正确解码最初的非 ASCII 字符串。*

您将需要使用另一种方法来获取原始字节，例如使用https://github.com/danguer/blog-examples/blob/master/js/base64-binary.js https://github.com/danguer/blog-examples/blob/master/js/base64-binary.js

var encoded = 'PD94bWwgdmVyc2lvbj0iMS4wIiBlbmNvZGluZz0iYmlnNSIgPz48dGl0bGU+pKSk5TwvdGl0bGU+';
var bytes = Base64Binary.decode(encoded);

然后使用某种方法将字节转换（即解码 big5 数据）为 Javascript 字符串。对于 Firefox / Chrome，您可以使用TextDecoder:

var decoder = new TextDecoder('big5'); 
var decoded = decoder.decode(bytes);

然后传递给DOMParser

var dom = (new DOMParser()).parseFromString(decoded, 'text/xml');
var title = dom.children[0].textContent;

你可以在以下位置看到这个https://plnkr.co/edit/TBspXlF2vNbNaKq8UxhW?p=preview https://plnkr.co/edit/TBspXlF2vNbNaKq8UxhW?p=preview

*理解原因的一种方法：atob不将原始字符串的编码作为参数，因此虽然它必须在内部将 Base64 编码的数据解码为字节，但它必须假设这些字节的字符编码是什么，然后为您提供一个 Javascript 字符串，该字符串我相信内部编码为 UTF-16。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 Javascript 在浏览器中解析非 UTF8 XML？的相关文章

如果对象包含在另一个数组中，则从数组中删除该对象

我试图从数组中删除一个对象如果该对象的属性唯一包含在另一个数组中我知道我可以像这样执行嵌套 for 循环 for i 0 i lt array length i for j 0 j lt array2 length j if arr
使用 xmllint 检查 XML 语法

我在处理某些 XML 打印文件时遇到问题其中源系统忽略将某些字符转换为其等效的 XML 语法例如未转换为 amp 有没有办法用 xmllint 捕获这个我不需要使用 XSD 检查一般树结构 xmllint noout your te
取消html5浏览器中的单图请求

我正在动态加载大图像以绘制到 html5 画布中如下所示 var t new Image t onload t src http myurl 但每隔一段时间就会想取消图片请求完全地我想出的唯一方法是设置src to i e t sr
访问sendBeacon发送的数据

文档表明sendBeacon通过发送其数据HTTP POST request 但在 PHP 中 POST变量似乎是一个空数组这是我的 JavaScript 代码 navigator sendBeacon beacon log php My
如何使用 selenium 和 Mocha 获取 xPath() 选择的锚标记的文本

我已经成功选择了 a 标签我想显示锚标记的文本但无法这样做我正在使用 selenium mocha javascript 和 phantomJS 这是我的脚本详细 var assert require assert var test
网站 YouTube 嵌入视频不断播放

我正在使用 youtube 提供的 iframe 在我的网站上嵌入视频我还使用了一个 css 弹出窗口这是我从这个页面学到的http www pat burt com web development how to do a css po
在Javascript中按降序对字符串进行排序（最有效）？

W3Schools 有这个例子 var fruits Banana Orange Apple Mango fruits sort fruits reverse 这是在 Javascript 中按降序对字符串进行排序的最有效方法吗 Updat
jQuery 选择 # id 以单词为前缀，计数器为后缀

有没有办法用 jQuery 选择所有带有前缀 my 和后缀 0 9 的 id 像这样的 my 1 4 还是可以用循环来实现 div div div div div div div div div div 第一个想法似乎效果很好 div i
Ember.js 处理 View 事件后转换到路由

Setup 我有一个 Ember 应用程序支持使用 Imgur API 上传图像我已经有一个工作路线和模板来处理任何 Imgur ID 但我想在上传新图像后转换到此路线使用返回的 Imgur ID 这是该应用程序的相关部分 http
检查 touchend 是否在拖动后出现

我有一些代码可以更改表的类在手机上有时表格对于屏幕来说太宽用户将拖动滚动来查看内容但是当他们触摸并拖动表格时每次拖动都会触发 touchend 如何测试触摸端是否是触摸拖动的结果我尝试跟踪dragstart和dragend
在为 RXJS 可观察量编写测试时，如何避免让调度程序通过我的业务逻辑？

我发现使某些测试通过的唯一方法是显式地将调度程序传递给函数为了便于说明请考虑以下函数 function doStuff stream return stream delay 100 filter x gt x 2 0 map x gt
Javascript - 将值从下拉框传递到 Google Maps API

我正在使用 Google 地图 API 为一家出租车公司创建报价表目前用户在 2 个文本框中输入出发点和接载点 API 会计算两点之间的距离以及行程费用我正在尝试添加两个具有设定位置的下拉框以便用户可以选择这些位置之一或使用文本框输
Twitter 嵌入时间轴小部件

我继续下载http platform twitter com widgets js http platform twitter com widgets js And the http platform twitter com embed t
查询为空 Node Js Sequelize

我正在尝试更新 Node js 应用程序中的数据我和邮递员测试过我的开发步骤是从数据库 MySQL 获取ID为10的数据进行更新 gt gt 未处理的拒绝SequelizeDatabaseError 查询为空我认识到我使用了错误的
如何在jquery中获取保存时间和当前时间的差异？

我想在 javascript 或 jquery 中获取保存时间和当前时间之间的时差我节省的时间看起来像Sun Oct 24 15 55 56 GMT 05 30 2010 java中的日期格式代码如下 String newDate 201
Nodejs mysql 获取正确的时间戳格式

我在用着mysqljs https github com mysqljs mysql得到结果后sql我变得不同TimeStamp格式如下 created at Sat Jul 16 2016 23 52 54 GMT 0430 IRDT 但
如何在 javascript 正则表达式中匹配平衡分隔符？

我原以为这个问题是不可能的据我所知 Javascript 的正则表达式既没有递归插值也没有漂亮的 NET 平衡组功能但问题就在那里如问题 12 所示正则表达式 alf nu http regex alf nu 匹配平衡对 lt an
防止文本区域出现新行

我正在开发聊天功能使用 Vue 并使用文本区域作为输入以便溢出换行并且对于编写较长消息的用户来说更具可读性不幸的是当用户按下 Enter 键并提交时光标会在提交之前移动到新行从而使用户体验感觉不佳关于如何使用普通 Javas
JAXB - 列表<可序列化>？

我使用 xjc 制作了一些课程 public class MyType XmlElementRefs XmlElementRef name MyInnerType type JAXBElement class required false
用于 C# XNA 的 Javascript（或类似）游戏脚本

最近我准备用 XNA C 开发另一个游戏上次我在 XNA C 中开发游戏时遇到了必须向游戏中添加地图和可自定义数据的问题每次我想添加新内容或更改游戏角色的某些值或其他内容时我都必须重建整个游戏或其他内容这可能需要相当长的时间有没

随机推荐

在 .NET 中，当我在附加线程中运行表单时如何设置 STAThread？

我正在第二个线程中运行表单如果我使用 Ctrl C 复制剪贴板上的文本则会出现异常在进行 OLE 调用之前必须将当前线程设置为单线程单元 STA 使用剪贴板显然涉及 OLE 将 STAThread 与我的线程过程这是我的第二个线程
如何在 Haskell 中强制主线程等待其所有子线程完成

在下面的 Haskell 代码中如何强制主线程等待其所有子线程完成我无法使用 forkFinally 如此链接中的终止程序部分所示 http hackage haskell org package base 4 7 0 2 docs
如何注册路由区域

我创建了具有 3 个不同区域的 MVC 应用程序管理员用户新闻这是 App Start 目录中我的 RouteConfig cs 文件 public class RouteConfig public static void Regi
如何访问自定义任务中的当前项目上下文？

如何在 MSBuild 中的自定义任务中访问当前项目上下文起初它看起来好像是 GlobalProjectCollection 参考项目集合 http msdn microsoft com en us library microsoft
在 Eclipse 中运行的 Tomcat 实例的“工作”目录位于哪里？

在 Eclipse 中您可以配置许多服务器在 IDE 中运行包括 Tomcat 根据您的 Tomcat 配置在 Web 应用程序生命周期的某个时刻您的 JSP 文件将被编译成 servlet 这些新的 servlet class文件
核心数据加载后异步刷新 UITableView Swift

我有一个 UITableView tViewNews 我有一个刷新功能它从服务器下载数据将其存储到核心数据中然后表视图从核心数据加载此数据效果很好 func refresh refreshControl UIRefreshContr
为什么 Thread.CurrentPrincipal 需要“await Task.Yield()”才能正确流动？

以下代码已添加到新创建的 Visual Studio 2012 NET 4 5 WebAPI 项目中我正在尝试分配两者HttpContext Current User and Thread CurrentPrincipal在异步方法中的
.NET Javascript 中的decimal.ToString(format)

我有一个字符串 00 可以与 NET 中的 aDecimal ToString 00 配合使用我想知道是否有人知道如何使用 javascript 实现这一点 There s toLocaleString 但不幸的是规范将其定义为依赖于
pyspark更改日期时间列中的日期

这段代码尝试更改日期时间列的日期有什么问题 import pyspark import pyspark sql functions as sf import pyspark sql types as sparktypes import da
插入带有自动递增主键的记录

我在 phpMyAdmin 中创建了一个 MySQL 数据库具有自动递增的主键 ID 在 phpMyAdmin 中我可以通过插入记录INSERT INTO MyTable VALUES null 1 2 3 空位置用于 ID 将数据库数据
Nodejs：在沙箱中运行模块

我有一个基于回合的 NodeJs 游戏应用程序开发人员任何人都可以在其中提交玩家机器人我的 NodeJS 应用程序将加载所有玩家并让他们互相对战因为我对提交的代码一无所知所以我需要在沙箱内运行它例如以下不受信任的代码可能如下
sys.argv 的值是字符串吗？我需要清单

我有一个在命令提示符下运行以下命令的 VBA 脚本 D WinPython 64bit 2 7 10 3 python 2 7 10 amd64 python exe D GITREPOS PythonInertia govlauncher
如何调用自定义约束验证作为本机验证事件流的一部分？

以下基于 Chrome 31 测试 TL DR 代码是怎么来的这把小提琴 http jsfiddle net barney j8yCQ 适用于尝试提交但不适用于this one http jsfiddle net barney j8a2s
温莎城堡内部可见到 Silverlight

我正在使用 Castle Windsor for SL v2 5 1 0 我让它代理内部类接口当然是公共的但实现是内部的因此消费者只知道接口我在程序集中使用以下属性和内部类 assembly InternalsVisibleTo C
JSLint 说“缺少基数参数”

我在这段 JavaScript 代码上运行 JSLint 它显示第 32 行第 30 行字符出现问题缺少基数参数这是有问题的代码 imageIndex parseInt id substring id length 1 1 这里有什么
iOS7 中的 UIRefreshControl 与 UICollectionView

在我的应用程序中我使用带有集合视图的刷新控件 UICollectionView collectionView UICollectionView alloc initWithFrame UIScreen mainScreen bounds
在 JSF 中使用绑定属性有什么优点？ [复制]

这个问题在这里已经有答案了请看下面的代码
为什么我应该使用 Runnable 而不是 Thread？ [复制]

这个问题在这里已经有答案了我刚刚学习了有关线程的理论还有Thread和Runnable class A extends Thread public void run while true System out println Hi cl
在 firestore 中按位置查询的最佳方式

我正在使用 Firebase 8 10 0 和 Vue js 2 6 14 我正在尝试在 Firestore 中查询距离我所在位置不到 3 公里的文档并发现我无法在 firestore 中执行此查询坦白说我很失望然后在观看视频后弗兰克
如何使用 Javascript 在浏览器中解析非 UTF8 XML？

我有一个用 big5 编码的 XML 字符串 atob PD94bWwgdmVyc2lvbj0iMS4wIiBlbmNvZGluZz0iYmlnNSIgPz48dGl0bGU pKSk5TwvdGl0bGU 以 UTF 8 格式我想提取内

如何使用 Javascript 在浏览器中解析非 UTF8 XML？

如何使用 Javascript 在浏览器中解析非 UTF8 XML？ 的相关文章

随机推荐

热门标签

如何使用 Javascript 在浏览器中解析非 UTF8 XML？的相关文章