检测并解析 JSON 文件中的转义字符“\”？

2023-12-04

我的 JSON 文件数据有问题。我正在使用来自谷歌的以下链接。

http://www.google.com/finance/company_news?q=AAPL&output=json"

当我想解析数据并将其显示在屏幕上时，就会出现问题。由于某种原因，数据未正确解码。

原始数据：

 1.) one which must have set many of the company\x26#39;s board on the edge of their
 2.) Making Less Money From Next \x3cb\x3e...\x3c/b\x3e

当我引入数据时，我会执行以下操作：

DefaultHttpClient httpClient = new DefaultHttpClient();
HttpPost httpPost = new HttpPost(url);
HttpResponse httpResponse = httpClient.execute(httpPost);
HttpEntity httpEntity = httpResponse.getEntity();
is = httpEntity.getContent();        
BufferedReader reader = new BufferedReader(new InputStreamReader(
                is, "iso-8859-1"), 8); 
StringBuilder sb = new StringBuilder();
String line = null;
        while ((line = reader.readLine()) != null) {
            sb.append(line + "n");
}
is.close();
json = sb.toString();

我使用 org.json 从 json 文件中提取数据收到的输出如下（注意缺少反斜杠）：

1.)one which must have set many of the companyx26#39;s board on the edge of their
2.)Making Less Money From Next x3cbx3e...x3c/bx3e

我目前处理第一个问题的方法是：

JSONRowData.setJTitle((Html.fromHtml((article.getString(TAG_TITLE).replaceAll("x26", "&")))).toString());

但第二个我却忽略了（没有双关语的意思）

我认为这不起作用的原因是反冲用于转义字符。我尝试了许多不同的方法来读取数据，但我没有运气。有没有一种方法可以在不使用正则表达式的情况下导入数据来处理这个问题？

Solution

我们今天的克星：“\x26”——ASCII（十六进制表示法）

将原始数据读入字符数组。 apache 的 commons.io 库是实现此目的的好方法。执行此操作后，在 for 循环中读取 char 数组，查找“\”，如果命中，则在下一个数组位置查找“x”。如果再次命中，则取出字符数组中的接下来的两个字符。这两个字符是您的 ASCII 十六进制值。将十六进制转换为十进制形式，然后将十进制转换为字符。获取此字符并将其附加到字符串生成器。

如果没有匹配（与“\”），则将字符附加到字符串生成器。我们现在可以调用.toString()方法并将其转为字符串。

从那里开始，数据可能包含一些 HTML 残余（' 和/或在这种情况下）。使用 Html.fromHtml() 解决了这个问题。

The problem here is that google -- or at least that url -- is supplying invalid JSON^1,2. The JSON library, while not rejecting the invalid JSON outright, is parsing it in a "well, let's ignore this \ nonsense and continue" manner. That is, it's not the rendering that is wrong, it is the input which is wrong.

¹It is not allowed for \x to appear in a string (except if the \ is itself escaped) as \ (when not escaped) can only be followed by a small set of characters (which does not include x). Escapes for character codes must be done by \u1234 and not \x12.

我能想到的唯一“修复”确实是粗俗的黑客：即读取原始文本并转换\x12 to \u0012。（其实，这并不是that糟糕的黑客行为，因为不需要考虑上下文相关的东西；然而，它应该not需要！对谷歌感到羞耻。）

² Extracted invalid JSON string literal:

“苹果公司（纳斯达克股票代码：AAPL）的股价今年继续领先大盘科技股。在周一开始的关键事件之后，该股的价格没有出现重大波动。”

（要使其有效，请将\x26 with \u0026 or &.)

祝你编码愉快，祝你好运:)

在 Java 中，一种[未经测试]的方法可能是使用正则表达式（通过String.replaceAll):

inputString.replaceAll("\\x(\d{2})", "\\u00$1")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

检测并解析 JSON 文件中的转义字符“\”？的相关文章

Run As JUnit 未出现在 Eclipse 中 - 使用 JUnit4

我正在尝试为我的 Web 应用程序编写 JUnit4 测试它们之前一直工作正常但是现在当我尝试通过右键单击类文件 gt Run As gt JUnit Test 来运行测试时我看不到该选项我认为这可能是因为一位同事意外提交了一些
Java写入ByteArrayOutputStream内存泄漏

我正在将图像字节写入ByteArrayOutputStream然后通过套接字发送它问题是当我这样做时 ImageIO write image gif byteArray 内存增加很多有点内存泄漏我用这个发送 ImageIO writ
无法在 PHP 中接收 JSON POST 请求

我正在将 JSON 对象从 Java 传递到 PHP 我正在使用 jdk 1 8 和 WAMPserver 下面是Java代码 import java io IOException import org apache http client
SQLite CursorWindow 限制 - 如何避免崩溃

我必须执行查询并将结果存储在列表中我使用的函数如下 List
画廊新媒体如何播放？

我试图收到有关添加到手机图库的新图片或视频的通知我需要获取新媒体的 URI 目的是让我可以自动备份它因此我需要一个在后台设置的寄存器来连续侦听或检查添加到图库的新媒体并捕获 Uri 这过去是通过广播接收器完成的例如
识别包含本机方法实现的库文件/源

如何识别包含本机方法实现的库文件 Ex public native String intern 我在哪里可以找到实施 source code of String intern 方法找到了答案String intern 与快速谷歌搜索 ht
Gradle 警告：不推荐使用variant.getOutputFile() 和variant.setOutputFile()

我在 Android 应用程序项目中使用以下简化配置 android compileSdkVersion 20 buildToolsVersion 20 0 0 defaultConfig minSdkVersion 8 targetSdk
RecyclerView：调整项目大小的动画

我有一个RecyclerView 回收者视图的每个项目都可以展开或不展开同一时间只能展开一项本质上我试图在棒棒糖拨号器中重新创建历史列表我发现在 RecyclerView 上使用 LayoutTransition https sta
NoSuchMethodError：org.springframework.data.repository.config.RepositoryConfigurationSource.getAttribute

我正在尝试在 spring boot 应用程序中使用 spring data redis 来使用 redis 我正在创造JedisConnectionFactory如下 RedisStandaloneConfiguration config
如何更新 Websphere 7 以使用 EL2.2？

这就是我所做的按照此林肯巴克斯特的帖子 http ocpsoft com java jsf2 java jsf2 how to add the magic of el el2 to jsf 我下载了 el api 2 2 jar 和 e
Android Studio - 程序类型已存在：com.google.android.gms.internal.measurement.zzwp

昨天我的应用程序运行良好今天不知道为什么重新打开Android Studio后应用程序就无法编译了显示的错误是 Program type already present com google android gms intern
JRuby调用了错误的方法

我在调用 Java 方法时遇到了一个奇怪的问题JRuby http en wikipedia org wiki JRuby 在我的 Java 类中这些方法定义了两次看来 JRuby 调用了错误的方法所以我尝试使用java method
控制台中的 Java msg - 两个方法具有相同的方法签名但不提供可分配的类？

在迁移到 java 1 8 时我升级了项目中的许多依赖项它是基于spring 4 3的应用程序有很多外部依赖例如 JMS HTTP客户端 FTP XML等当应用程序启动时我现在在控制台中收到以下消息两个方法具有相同的方法签名但
在 libgdx 中截取屏幕截图

我有一个应用程序我想在其中截取游戏屏幕的屏幕截图并将其保存为图像并上传到 Facebook 我正在使用 Libgdx 我的重点是 android 谁能帮助我如何以编程方式截取游戏屏幕并将其另存为图像现在相当容易 Libgdx提供了一个例
在java中访问dll方法

我正在尝试访问java中用c 编写的dll方法从下面的代码我试图构建已成功生成的 dll using System using Microsoft Win32 namespace CyberoamWinHelper public clas
JdbcTemplate queryForInt/Long 在 Spring 3.2.2 中已弃用。应该用什么来代替呢？

JdbcTemplate 中的 queryforInt queryforLong 方法在 Spring 3 2 中已弃用我无法找出为什么或什么被认为是使用这些方法替换现有代码的最佳实践典型方法 int rowCount jscoreJd
如何为Android编译最新的FFmpeg库？

努力将当前 FFmpeg 的工作和一般最佳实践构建在一起似乎没有最新的文档或教程现有的内容充满了过时的链接或不起作用的构建脚本构建独立的 NDK 工具链下载最新的NDK并运行make standalone toolchain py
将文本文件写入 SD 卡失败

我遇到了一个奇怪的问题我的应用程序可以将一个简单的文本文件写入 SD 卡有时它对某些人有效但对其他人无效我不知道为什么对于某些人来说如果他们输入一些字符例如在文件等中我似乎无法重现它因为我没有遇到任何麻烦但这是处理文件
GridLayout 中的 JLabel

如何添加JLabel出于GridLayout 我有一个 8x8 网格布局 Container content getContentPane content setLayout new GridLayout 8 8 2 2 for int f
Ionic 3 Deeplinking - 从 URL 启动应用程序

我正在使用 Ionic 开发一个跨平台应用程序当尝试实现深度链接时我安装了一个名为 Ionic Native 插件深层链接我运行了这些命令 ionic cordova plugin add ionic plugin deeplinks

随机推荐

标签' aria-label='

检测并解析 JSON 文件中的转义字符“\”？

检测并解析 JSON 文件中的转义字符“\”？ 的相关文章

随机推荐

检测并解析 JSON 文件中的转义字符“\”？的相关文章