inputStream 和 utf 8 有时显示“?”人物

2024-03-31

所以我已经处理这个问题一个多月了，我还通过谷歌检查了几乎所有可能的相关解决方案，但我找不到任何真正解决我的情况的东西。我的问题是我正在尝试从网站下载 html 源代码，但在大多数情况下我得到的是某些文本显示一些“？”其中的字符，很可能是因为该网站是希伯来语的。这是我的代码，

    public static InputStream openHttpGetConnection(String url)
            throws Exception {
        InputStream inputStream = null;
        HttpClient httpClient = new DefaultHttpClient();
        HttpResponse httpResponse = httpClient.execute(new HttpGet(url));
        inputStream = httpResponse.getEntity().getContent();
        return inputStream;

    }
    public static String downloadSource(String url) {
        int BUFFER_SIZE = 1024;

        InputStream inputStream = null;
        try {
            inputStream = openHttpGetConnection(url);
        } catch (Exception e) {
            // TODO: handle exception
        }
        int bytesRead;
        String str = "";
        byte[] inpputBuffer = new byte[BUFFER_SIZE];
        try {
            while ((bytesRead = inputStream.read(inpputBuffer)) > 0) {
                String read = new String(inpputBuffer, 0, bytesRead,"UTF-8");
                str +=read;

            }
        } catch (Exception e) {
            // TODO: handle exception
        }
        return str;

    }

Thanks.

要从给定编码的字节流中读取字符，请使用Reader。在你的情况下，它会是这样的：

    InputStreamReader isr = new InputStreamReader(inpputStream, "UTF-8");
    char[] inputBuffer = new char[BUFFER_SIZE];

    while ((charsRead = isr.read(inputBuffer, 0, BUFFER_SIZE)) > 0) {
        String read = new String(inputBuffer, 0, charsRead);
        str += read;
    }

您可以看到字节将直接作为字符读入——读者的问题是知道是否需要读取一个或两个字节，例如，在缓冲区中创建字符。这基本上是您的方法，但是在读入字节时进行解码，而不是在读入字节之后进行解码。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

UTF8

inputStream 和 utf 8 有时显示“?”人物的相关文章

策略模式还是命令模式？

假设我有一个金融交易列表我需要针对这些交易执行一系列验证规则一个例子是我有一笔购买产品的交易但是首先我需要验证交易中的帐户是否有足够的可用资金产品没有售完等由于这些规则交易将是标记为拒绝并应指定错误代码当然我正在考虑用一个
使类只能从特定类实例化

假设我有 3 节课class1 class2 and class3 我怎样才能拥有它class1只能通过实例化class2 class1 object new class1 但不是 class3 或任何其他类我认为它应该与修饰符一起使用
如何作为应用程序发布到页面？

所以我有一个应用程序 Facebook 应用程序实体并且我有一个页面我想使用应用程序通过java代码通过restfb或任何其他建议发布到页面看起来我错过了页面授予应用程序发布权限的阶段不知道该怎么做谢谢你们乌里您只能作
从 Spring MVC XML 文件转移到 javaconfig。我真的对我的数据库 XML 文件感到困惑

我从 Spring MVC XML 文件转移到 javaconfig 我真的对我的数据库 XML 文件感到困惑我不知道如何让 Hibernate4 工作以及我的 JBoss JNDI 数据源工作有人可以告诉我如何使 javaconfig
查询 MongoDB 集合中的字段。

我正在尝试查询 mongodb 集合中的特定字段这是我的代码和输出 Mongo m new Mongo DB db m getDB mydb DBCollection coll db getCollection student addin
记录共享和映射的诊断上下文

据我所知其他人做了什么来解决 Commons Logging 项目针对 NET 和 Java 不支持映射或嵌套诊断上下文这一事实执行摘要我们选择直接使用实现者日志框架在我们的例子中为 log4j 长答案您是否需要一个抽象日志框架
可访问数据的 Java 约定。（公共访问器和 Getter/命名）

通过 Java API 您会看到大量冲突的命名和实践这让我感到非常困惑例如 The String http grepcode com file repository grepcode com java root jdk openjdk
无法在 Java 中输出正确的哈希值。怎么了？

在我的 Android 应用程序中我有一个 SHA256 哈希值我必须使用 RIPEMD160 消息摘要算法进一步对其进行哈希值我可以输出任何字符串的正确 sha256 和ripemd160 哈希值但是当我尝试使用ripemd160
确定序列化对象的类型

我需要通过套接字发送消息从用户到引擎的请求以及从引擎到用户的响应所以流程本质上是 serialized request Server lt network gt Client serialized response request r
具有 JPA 持久性的 Spring 状态机 - 存储库使用

我试图弄清楚如何轻松使用 Spring 状态机包括使用 JPA 进行持久化这是我正在处理的问题不兼容的数据类型工厂和持久性在程序的某个时刻我想使用连接到用户的状态机有用于此目的的存储库项目spring statemachin
如何从字符串中解析一个大整数？ [复制]

这个问题在这里已经有答案了我有一个这样的方法 Integer parseInt myInt 不是这个整数变得很长我得到以下异常 java lang NumberFormatException For input string 40001
如何从intellij项目视图中隐藏不必要的文件？

给定一个示例 gradle 项目其项目结构如下所示正如你所看到的有很多东西你实际上不需要在想法中看到但你需要它们存在我知道下面被忽略的文件文件夹类型Editor File Types但这些正在影响库和项目 idea 会在各处忽略
如何减去两个 XmlGregorianCalendar 对象来创建一个 Duration 对象？

我想计算两个时间之间的差值XmlGregorianCalendar对象从而创建一个Duration object 但我还没有找到执行减法的干净方法你会怎么做那应该是 DatatypeFactory newDuration xgc2 t
当底层连接是有状态时如何使用 Apache HttpClient？

我在谷歌上搜索了很多关于如何使用 HttpClient 进行多线程处理的信息他们中的大多数人建议使用 ThreadSafeClientConnManager 但我的应用程序必须登录某个主机登录表单页面以便 HttpClient 获得底
Android UnityPlayerActivity 操作栏

我正在构建一个 Android 应用程序其中包含 Unity 3d 交互体验我已将 Unity 项目导入 Android Studio 但启动时该 Activity 是全屏的并且不显示 Android 操作栏我怎样才能做到这一点整
使用 PC/SC 读卡器验证 Ultralight EV1

我在尝试使用 Java 中的 PC SC 读卡器特别是 ACR1222L 验证 Ultralight EV1 卡时遇到问题我能够使用 ISO 14443 3 标签的相应 APDU 在不受保护的标签上进行写入和读取但是我找不到运行 P
让 Hibernate 和 SQL Server 与 VARCHAR 和 NVARCHAR 良好配合

我目前正在大型数据库的某些表中启用 UTF 8 字符这些表已经是 MS SQL 类型 NVARCHAR 此外我还有几个使用 VARCHAR 的字段 Hibernate 与 JDBC 驱动程序的交互存在一个众所周知的问题例如参见在 h
Axis2 错误：要输出的文本中的空白字符 (0x4) 无效

我创建了一个 Java 客户端使用 Axis2 1 7 6 作为代码生成器与 SOAP Web 服务进行交互问题在于客户端的某些输入抛出异常并显示以下消息 org apache axis2 AxisFault Invalid white
spring data jpa复合键重复键记录插入导致更新

我有一个具有复合键的实体我试图通过使用 spring data jpa 存储库到 mysql 数据库来持久化它如下所示 Embeddable public class MobileVerificationKey implements S
为什么java.lang.Cloneable不重写java.lang.Object中的clone()方法？

Java 规范java lang Cloneable接口将自身定义为表示扩展它的任何对象也实现了clone 休眠的方法java lang Object 具体来说它说一个类实现了Cloneable接口来指示java lang Object

随机推荐

我应该使用公共变量还是私有变量？

我第一次做一个大型项目我有很多类其中一些具有公共变量一些具有带有 setter 和 getter 方法的私有变量并且相同具有两种类型我决定重写此代码以主要仅使用一种类型但我不知道应该使用哪个仅用于同一对象中的方法的变量始终是私
Visual Studio 2005/2012：如何将第一个花括号保持在同一行？

尝试让我的 css C 函数看起来像这样 body color 222 而不是这个 body color 222 当我自动格式化代码时 C In the Tools菜单点击Options Click 显示所有参数左下角的复选框显示所有设
使用 C# 按创建日期降序获取目录中的文件列表

我想使用 C 获取按创建日期排序的文件夹中的文件列表我正在使用以下代码 if Directory Exists folderpath DirectoryInfo dir new DirectoryInfo folderpath FileI
URL 问号后面的部分是什么术语？

http www example com foo 该术语是什么foo网址的一部分这是query 或者有时请求参数从中捏取有用的图表URI RFC https datatracker ietf org doc html rfc3986 s
lua检查多个值是否相等

我喜欢用 Roblox 制作游戏并用 lua 编写代码在编写游戏时我发现自己经常问一个值是否等于另一个值这可能会产生很长的代码行并且可能非常重复例如如果 x ClassName 衬衫或x ClassName 附件或x Cl
（转）发送http请求时如何控制gzip压缩？

我想问一下大家在请求HTTP Post消息时如何控制gzip压缩 Accept Encoding gzip 作为 Http 请求标头始终添加到我发送的 http 请求中但我不想使用 gzip 压缩我该如何处理在执行http NewRe
在onPause而不是onDestroy中释放资源

这是关于后蜂窝状即Android 3 0 以及下面的引用来自https developer android com reference android app Activity html https developer android c
Rails 应用程序错误 - ActiveRecord::PendingMigrationError 迁移正在挂起；运行“rake db:migrate RAILS_ENV=development”来解决此问题

数据库已创建表已创建数据已存在但是当我重新启动Rails应用程序后我收到了这个错误该应用程序正在使用 MySQL 这里有什么问题先感谢您 Solution 只需运行 rake db migrate 在服务器启动之前需要运行一些迁
如何向java简单日期格式添加天数

如何在使用简单日期格式获得的当前日期上添加 120 天我看过一些关于它的帖子但无法让它发挥作用我的代码如下 SimpleDateFormat dateFormat new SimpleDateFormat dd MM yyyy get
使用 JavaScript 打开另一个 html 页面时传递变量

这可能是一个非常愚蠢的问题但我在网上找不到它而且我已经寻找了至少一个小时我有一个链接 a href MusicMe html Instruments a 我想在单击后获取它的 ID 因为我需要将一些变量传递到我打开的页面以知道仪器链接
2 个 2D 向量的叉积

任何人都可以提供一个返回叉积的函数的示例TWO二维向量我正在尝试实施这个算法 http www blackpawn com texts pointinpoly default html C 代码会很棒谢谢 EDIT 找到了另一种适用于
查找 NxN 网格中所有路径的算法

想象一个机器人坐在 NxN 网格的左上角机器人只能向两个方向移动向右和向下机器人有多少种可能的路径我可以在谷歌上找到这个问题的解决方案但我对解释不是很清楚我试图清楚地理解如何解决这个问题并用Java实现的逻辑任何帮助表示赞赏
Android 自定义视图应扩展 AppCompatTextView

我创建了简单的自定义视图它扩展自TextView 在 Android Studio 中我收到此警告 This custom view should extend android support v7 widget AppCompatTex
独立移动应用程序上的 WebRTC

我知道WebRTC是为浏览器设计的但是可以直接在移动应用程序上使用WebRTC库吗 Thanks 截至5月14日here https github com pchab AndroidRTC是一个android项目使用WebRTC效果很好
为什么我不能在 kotlin 中使用 lambda 接口？ [复制]

这个问题在这里已经有答案了看我有一个 Java 类 public final class JavaReceiveSingle public static void useSingle Single single single doSth
为什么仅当我在 SDL2 中设置非零 Alpha 大小时才获得 sRGB 帧缓冲区？

我正在尝试通过以下方式以伽玛正确的方式渲染典型的 OpenGL 颜色三角形本指南 https learnopengl com Advanced Lighting Gamma Correction并查阅 SDL2 文档了解如何在默认帧缓冲区
在类似热图的图中写入值，但对于seaborn中的分类变量

我在类似热图的图中绘制了一个数据框我想写入单元格但不是单元格的值但我将该值与条件进行比较并告诉它是哪种错误例如 import pandas as pd import seaborn as sns matplotlib inline
在 Android 模拟器中不使用 -writable-system 时，Hosts 文件中的更改会丢失

我通过使用标志 writable system 启动模拟器来更新 Android 模拟器中的 system etc hosts 文件 emulator exe avd tablet writable system 当我在没有 writabl
Redshift 中“ADD COLUMN IF NOT EXISTS”的解决方法

我正在尝试通过 Spark Redshift 执行 S3 复制操作并且希望在运行复制命令之前修改 Redshift 表结构以便添加任何缺失的列它们应该都是 VARCHAR 我能做的是在运行副本之前发送一个 SQL 查询所以理想情况下
inputStream 和 utf 8 有时显示“?”人物

所以我已经处理这个问题一个多月了我还通过谷歌检查了几乎所有可能的相关解决方案但我找不到任何真正解决我的情况的东西我的问题是我正在尝试从网站下载 html 源代码但在大多数情况下我得到的是某些文本显示一些其中的字符很可能是因为该网

inputStream 和 utf 8 有时显示“?”人物

inputStream 和 utf 8 有时显示“?”人物 的相关文章

随机推荐

热门标签

inputStream 和 utf 8 有时显示“?”人物的相关文章