如何正确读取utf8字符的url内容？

2023-12-29

    public class URLReader {
         public static byte[] read(String from, String to, String string){
          try {
           String text = "http://translate.google.com/translate_a/t?"+
                        "client=o&text="+URLEncoder.encode(string, "UTF-8")+
                        "&hl=en&sl="+from+"&tl="+to+"";

           URL url = new URL(text);
           BufferedReader in = new BufferedReader(
                        new InputStreamReader(url.openStream(), "UTF-8"));
           String json = in.readLine();
           byte[] bytes = json.getBytes("UTF-8");
           in.close();
           return bytes;
                    //return text.getBytes();
          }
          catch (Exception e) {
           return null;
          }
         }
        }

and:

public class AbcServlet extends HttpServlet {
 public void doGet(HttpServletRequest req, HttpServletResponse resp) throws IOException {
  resp.setContentType("text/plain;charset=UTF-8");
  resp.getWriter().println(new String(URLReader.read("pl", "en", "koń")));
 }
}

当我运行这个时，我得到：{"sentences"[{"trans":"end","orig":"koďż˝","translit":"","src_translit":""}],"src":"pl","server_time":30}所以 utf 无法正常工作，但如果我返回编码的网址：http://translate.google.com/translate_a/t?client=o&text=ko%C5%84&hl=en&sl=pl&tl=en并粘贴到网址栏，我得到正确的结果：{"sentences":[{"trans":"horse","orig":"koń","translit":"","src_translit":""}],"dict":[{"pos":"noun","terms":["horse"]}],"src":"pl","server_time":76}

byte[] bytes = json.getBytes("UTF-8");

为您提供 UTF-8 字节序列，因此 URLReader.read 也为您提供 UTF-8 字节序列

但您尝试在不指定编码器的情况下进行解码，即new String(URLReader.read("pl", "en", "koń"))所以Java将使用你的系统默认编码来解码（不是UTF-8）

Try :

new String(URLReader.read("pl", "en", "koń"), "UTF-8")

Update

这是我的机器上完整工作的代码：

public class URLReader {

    public static byte[] read(String from, String to, String string) {
        try {
            String text = "http://translate.google.com/translate_a/t?"
                    + "client=o&text=" + URLEncoder.encode(string, "UTF-8")
                    + "&hl=en&sl=" + from + "&tl=" + to + "";
            URL url = new URL(text);
            URLConnection conn = url.openConnection();
            // Look like faking the request coming from Web browser solve 403 error
            conn.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows; U; Windows NT 6.1; en-GB; rv:1.9.2.13) Gecko/20101203 Firefox/3.6.13 (.NET CLR 3.5.30729)");
            BufferedReader in = new BufferedReader(new InputStreamReader(conn.getInputStream(), "UTF-8"));
            String json = in.readLine();
            byte[] bytes = json.getBytes("UTF-8");
            in.close();
            return bytes;
            //return text.getBytes();
        } catch (Exception e) {
            System.out.println(e);
            // becarful with returning null. subsequence call will return NullPointException.
            return null;
        }
    }
}

不要忘记将 ń 转义为 \u0144。 Java 编译器可能无法正确编译 Unicode 文本，因此最好用纯 ASCII 编写它。

public class AbcServlet extends HttpServlet {

    @Override
    public void doGet(HttpServletRequest req, HttpServletResponse resp) throws IOException {
        resp.setContentType("text/plain;charset=UTF-8");
        byte[] read = URLReader.read("pl", "en", "ko\u0144");
        resp.getOutputStream().write(read) ;
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何正确读取utf8字符的url内容？的相关文章

@RestController 没有 @ResponseBody 方法工作不正确

我有以下控制器 RestController RequestMapping value base url public class MyController RequestMapping value child url method Req
如何在 Firebase 远程配置中从 JSON 获取值

我是 Android 应用开发和 Firebase 的新手我想知道如何获取存储在 Firebase 远程配置中的 JSONArray 文件中的值 String 和 Int 我使用 Firebase Remote Config 的最终目标是
使用 GWT 读取非常大的本地 XML 文件

我正在使用 GWT 构建我的第一个 Java 应用程序它必须从一个非常大的 XML 文件中读取数据当我尝试发送对文件中信息的请求时遇到问题并且我不太确定它是否与文件的大小或我的语义有关在我的程序中我有以下内容 static fin
Integer.parseInt("0x1F60A") 以 NumberformatException 结束

我尝试从数据库中获取长字符串内的表情符号代码格式如下 0x1F60A 所以我可以访问代码但它将是String 起初我尝试通过执行以下操作来转换变量tv setText beforeEmo getEmijoByUnicode int e
是否可以使用 Flying Saucer (XHTML-Renderer) 将 css 解析为类路径资源？

我正在尝试将资源打包到 jar 中但我无法让 Flying Saucer 在类路径上找到 css 我无法轻松构建 URL 来无缝解决此问题 https stackoverflow com questions 861500 url to l
来自十六进制代码的 Apache POI XSSFColor

我想将单元格的前景色设置为十六进制代码中的给定颜色例如当我尝试将其设置为红色时 style setFillForegroundColor new XSSFColor Color decode FF0000 getIndexed 无论我在
什么时候可以在 Java 中使用 Thead.stop() ？

Thread stop 的 Java 文档听起来好像如果您调用 Thread stop 世界就会终结已弃用这种方法本质上是不安全的停止线程 Thread stop 导致它解锁所有已锁定的监视器作为未经检查的 ThreadDeath
需要使用 joda 进行灵活的日期时间转换

我想使用 joda 解析电子邮件中的日期时间字符串不幸的是我得到了各种不同的格式例如 Wed 19 Jan 2011 12 52 31 0600 Wed 19 Jan 2011 10 15 34 0800 PST Wed 19 Jan
套接字的读写如何同步？

我们创建一个套接字在套接字的一侧有一个服务器在另一侧有一个客户端服务器和客户端都可以向套接字写入和读取这是我的理解我不明白以下事情如果服务器从套接字读取数据它在套接字中是否只看到客户端写入套接字的内容我的意思是如果服务
生成的序列以 1 开头，而不是注释中设置的 1000

我想请求一些有关 Hibernate 创建的数据库序列的帮助我有这个注释下面的代码在我的实体类中以便为合作伙伴表提供单独的序列我希望序列以 1000 开头因为我在部署期间使用 import sql 将测试数据插入数据库并且我希
如何在 Spring 属性中进行算术运算？
使用架构注册表对 avro 消息进行 Spring 云合约测试

我正在查看 spring 文档和 spring github 我可以看到一些非常基本的内容examples https github com spring cloud samples spring cloud contract sample
HashMap 值需要不可变吗？

我知道 HashMap 中的键需要是不可变的或者至少确保它们的哈希码 hashCode 不会改变或与另一个具有不同状态的对象发生冲突但是 HashMap中存储的值是否需要与上面相同为什么或者为什么不这个想法是能够改变值例如在其上调
Docker 和 Eureka 与 Spring Boot 无法注册客户端

我有一个使用 Spring Boot Docker Compose Eureka 的非常简单的演示我的服务器在端口 8671 上运行具有以下应用程序属性 server port 8761 eureka instance prefer i
返回 Java 8 中的通用函数接口

我想写一种函数工厂它应该是一个函数以不同的策略作为参数调用一次它应该返回一个函数该函数根据参数选择其中一种策略该参数将由谓词实现嗯最好看看condition3为了更好的理解问题是它没有编译我认为因为编译器无法弄清楚函数式
在 Google App-Engine JAVA 中将文本转换为字符串，反之亦然

如何从字符串转换为文本 java lang String to com google appengine api datastore Text 反之亦然 Check Javadoc http code google com appengin
Hamcrest Matchers - 断言列表类型

问题我目前正在尝试使用 Hamcrest Matchers 来断言返回的列表类型是特定类型例如假设我的服务调用返回以下列表 List
Resteasy 可以查看 JAX-RS 方法的参数类型吗？

我们使用 Resteasy 3 0 9 作为 JAX RS Web 服务最近切换到 3 0 19 我们开始看到很多RESTEASY002142 Multiple resource methods match request警告例如我们
Android：无法发送http post

我一直在绞尽脑汁试图弄清楚如何在 Android 中发送 post 方法这就是我的代码的样子 public class HomeActivity extends Activity implements OnClickListener pr
将 Apache Camel 执行器指标发送到 Prometheus

我正在尝试转发添加 Actuator Camel 指标 actuator camelroutes 将交换交易数量等指标发送到 Prometheus Actuator 端点有没有办法让我配置 Camel 将这些指标添加到 Promet

随机推荐

提取每第 n 个字母（数字）

我有一个包含行名称空格和零和一字符串的文件我需要提取零和一字符串的每第 5 个字符对结果求和如果总和不为 0 保存名称到另一个文件中 1rt2 0001000000100000000000001010000100000000010
框架“可扩展性良好”是什么意思？

当阅读有关框架 net ruby on Rails django spring 等时我不断地看到某些框架的扩展性很好或不好当有人说框架可扩展性良好时这是什么意思而说框架可扩展性不好又是什么意思谢谢当您根据并发用户绘制一
简单的 Javascript 数学函数 - 加法/不起作用？

这是我的功能 var ans X X Y Z 当我进入10 20 and 10 分别加法位的结果为2010并不是30 我怎样才能解决这个问题确保首先将字符串转换为数字 var X 10 var Y 20 var Z 10 X X una
如何在 SQL*Plus 中打开存储过程并对其进行编辑

我需要对一个过时的机器上的旧 Oracle 存储过程进行一些更改该机器保留下来运行旧的遗留进程我唯一可以连接到数据库的工具是 SQL加如何将存储过程加载到内存中以在 SQL 中进行编辑Plus 我在网上找到的教程没有解释这是如何完成的
git push 说一切都是最新的，而实际上它绝对不是

我有一个公共存储库没有其他人对其进行分叉拉取或其他任何操作我对一个文件做了一些小的更改成功提交它们并尝试推送它说一切都是最新的没有分支机构我对 git 非常非常陌生我不明白到底发生了什么 git remote show
如何在SQL Server中为自动增量列指定特定值？

我在 sql server 中有一个自动增量标识列但我想为其中一行指定特定值因此编号方案如下 1 2 999 for the reserved entry 3 n 我怎样才能做到这一点你需要使用IDENTITY INSERT SET
适用于 iOS 的 Elasticsearch 客户端

有人知道适用于 iOS 的 elasticsearch 客户端库吗如果它也用 swift 编写那就太好了弹性搜索客户端部分显示了多个平台的多个库但没有显示 iOS 的任何内容我觉得一定有人这样做了 Cheers 我怀疑没有人这
Rust：使用结构向量的极坐标中的数据帧

Problem 我想读入数据polars数据帧来自mysql数据库我在用sqlx sqlx生成结构向量例如 Vec
安装oracle 11g后sql plus打不开

我安装了 oracle 11g 我试图从命令提示符打开 sqlplus 但它在不到一秒的时间内打开和关闭我也尝试从安装位置打开 sqlplus 它仍然显示出相同的行为谁能帮我解决一下由于其他一些错误我已经卸载并安装了两次 oracl
Pyparsing 支持上下文相关语法吗？

如果我的术语不正确请原谅我也许只要用正确的词语来描述我想要的东西就足以让我自己找到答案我正在开发 ODL 对象描述语言的解析器据我所知这是一种神秘的语言现在仅由 NASA PDS 行星数据系统这是 NASA 向公众提供数
git Android Studio 使用的 ssh-key

我需要连接到一个组织因此需要提供公共 ssh 密钥但是我不确定 Android Studio 使用哪个 ssh 密钥我发现自己对 Android Studio 中的各种 ssh 选项感到困惑它是否只是使用我当前 git 安装生成的
Laravel 在关系对象上的位置

我正在使用 Laravel 5 0 开发一个 Web API 但我不确定我正在尝试构建的特定查询我的课程如下 class Event extends Model protected table events public timestam
zsh：在函数中设置opt并使其粘住

我正在尝试将分析添加到函数内部的 zshrc 中 via http stackoverflow com a 4351664 329700 profile startup PS4 usr local bin gdate s N N i gt
在 ASP.NET 5 中使用 WebClient

我正在使用 VS15 beta 并尝试使用 WebClient 虽然引用了 System Net 并且智能感知表明 WebClient 类可用但在构建时出现以下错误命名空间 System Net 中不存在类型或命名空间名称 WebCli
JavaScript - 从字符串变量获取数组对象

var list OVER 30 true NUM OF JACKETS gt 3 COUNT TOTAL 500 var array getList array 0 OVER 30 true array 0 NUM OF JACKETS
错误：无法为 pymssql 构建轮子，这是在 Mac M1 中安装基于 pyproject.toml 的项目所必需的

我使用的是带有 M1 芯片的 MacBook 但似乎有很多东西没有针对它进行优化 pyodbc不适合我所以我想使用pymssql 不过当我尝试运行时遇到了这个问题pip install pymssql 错误如下 Using cached
Swift Swiftui - 将颜色保存到 UserDefaults 并从 @AppStorage 使用它

在我的 MacOS 和 iOS 应用程序中我使用从此处创建的颜色 https uiwjs github io ui color https uiwjs github io ui color 然后是 f e 工作正常 Color red 1
无损 ffmpeg 转换/编码

我在转换视频时寻找最好的质量我只想使用无损音频和视频编码器以及一个好的容器如何为 ffmpeg 启用无损 x264 vcodec 我目前使用ffmpeg i inputvideo s 1280x720 ar 48000 threads
为什么 autograd 不产生中间变量的梯度？

尝试了解渐变的表示方式以及 autograd 的工作原理 import torch from torch autograd import Variable x Variable torch Tensor 2 requires grad Tr
如何正确读取utf8字符的url内容？

public class URLReader public static byte read String from String to String string try String text http translate google

如何正确读取utf8字符的url内容？

如何正确读取utf8字符的url内容？ 的相关文章

随机推荐

热门标签

如何正确读取utf8字符的url内容？的相关文章