为什么 Java BufferedReader() 不能正确读取阿拉伯文和中文字符？

2024-05-08

我正在尝试读取一个每行包含英文和阿拉伯字符的文件以及另一个每行包含英文和中文字符的文件。然而，阿拉伯文和中文的字符无法正确显示 - 它们只是显示为问号。知道我该如何解决这个问题吗？

这是我用于阅读的代码：

try {
        String sCurrentLine;
        BufferedReader br = new BufferedReader(new FileReader(directionOfTargetFile));
        int counter = 0;

        while ((sCurrentLine = br.readLine()) != null) {
            String lineFixedHolder = converter.fixParsedParagraph(sCurrentLine);
            System.out.println("The line number "+ counter
                               + " contain : " + sCurrentLine);
            counter++;
        }
    }

01版

阅读该行并获得阿拉伯语和中文单词后，我使用一个函数通过简单地搜索来翻译它们给定阿拉伯语文本在 ArrayList 中（包含所有预期的单词）（使用 indexOf(); 方法）。然后，当找到单词的索引时，它会用来调用另一个 Arraylist 中具有相同索引的英语单词。然而，此搜索始终返回 false，因为在搜索问号而不是阿拉伯字符和中文字符时失败。因此，我的 System.out.println 打印显示了空值，每次翻译失败都有一个空值。

*我使用的是Netbeans 6.8 Mac版IDE

02版

这是搜索翻译的代码：

        int testColor = dbColorArb.indexOf(wordToTranslate);
        int testBrand = -1;
        if ( testColor != -1 ) {
            String result = (String)dbColorEng.get(testColor);
            return result;
        } else {
            testBrand = dbBrandArb.indexOf(wordToTranslate);
        }
        //System.out.println ("The testBrand is : " + testBrand);
        if ( testBrand != -1 ) {
            String result = (String)dbBrandEng.get(testBrand);
            return result;
        } else {
            //System.out.println ("The first null");
            return null;
        }

我实际上正在搜索 2 个数组列表，其中可能包含要翻译的所需单词。如果未能在两个 ArrayList 中找到它们，则返回 null。

03版

当我调试时，我发现正在读取的行存储在我的字符串变量中，如下所示：

 "3;0000000000;0000001001;1996-06-22;;2010-01-27;����;;01989;������;"

03版

我正在阅读的文件是在被另一个程序修改后交给我的（除了它是用 VB 编写的之外，我对此一无所知），该程序使未正确显示的阿拉伯字母出现。当我在 Notepad++ 上检查文件的编码时，它显示它是 ANSI。然而，当我将其转换为UTF8（用其他英文字母替换阿拉伯字母）然后将其转换回ANSI时，阿拉伯语变成了问号！

FileReader javadoc http://java.sun.com/javase/6/docs/api/java/io/FileReader.html:

读取字符文件的便利类。此类的构造函数假定默认字符编码和默认字节缓冲区大小是适当的。要自己指定这些值，请在 FileInputStream 上构造一个 InputStreamReader。

So:

Reader reader = new InputStreamReader(new FileInputStream(fileName), "utf-8");
BufferedReader br = new BufferedReader(reader);

如果这仍然不起作用，则可能您的控制台未设置为正确显示 UTF-8 字符。配置取决于所使用的 IDE，并且相当简单。

Update :在上面的代码中替换utf-8 with cp1256。这对我来说效果很好（WinXP，JDK6）

但我建议您坚持使用 UTF-8 生成文件。因为cp1256对中文不起作用，你会再次遇到类似的问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 Java BufferedReader() 不能正确读取阿拉伯文和中文字符？的相关文章

ElasticBeanstalk Java，Spring 活动配置文件

我正在尝试通过 AWS ElasticBeanstalk 启动 spring boot jar 一切正常配置文件为默认有谁知道如何为 java ElasticBeanstalk 应用程序不是 tomcat 设置活动配置文件 spri
CXF Swagger2功能添加安全定义

我想使用 org apache cxf jaxrs swagger Swagger2Feature 将安全定义添加到我的其余服务中但是我看不到任何相关方法或任何有关如何执行此操作的资源下面是我想使用 swagger2feature 生成
java中删除字符串中的特殊字符？

如何删除字符串中除之外的特殊字符现在我用 replaceAll w s 它删除了所有特殊字符但我想保留谁能告诉我我该怎么办 Use replaceAll w s 我所做的是将下划线和连字符添加到正则表达式中我添加了一个连字符之前
Java 页面爬行和解析之 Crawler4j 与 Jsoup

我想获取页面的内容并提取其中的特定部分据我所知此类任务至少有两种解决方案爬虫4j https github com yasserg crawler4j and Jsoup http jsoup org 它们都能够检索页面的内容并提取其
如何在jsp代码中导入java库？

我有以下jsp代码我想添加 java io 等库我怎样才能做到这一点
Microsoft Graph 身份验证 - 委派权限

我可以使用 Microsoft Graph 访问资源无需用户即可访问 https developer microsoft com en us graph docs concepts auth v2 service 但是此方法不允许我访问需
无法理解 Java 地图条目集

我正在看一个 java 刽子手游戏 https github com leleah EvilHangman blob master EvilHangman java https github com leleah EvilHangman b
在具有相同属性名称的不同数据类型上使用 ModelMapper

我有两节课说Animal AnimalDto我想用ModelMapper将 Entity 转换为 DTO 反之亦然但是对于具有相似名称的一些属性这些类应该具有不同的数据类型我该如何实现这一目标动物 java public class
从 android 简单上传到 S3

我在网上搜索了从 android 上传简单文件到 s3 的方法但找不到任何有效的方法我认为这是因为缺乏具体步骤 1 https mobile awsblog com post Tx1V588RKX5XPQB TransferManage
Spring Data 与 Spring Data JPA 与 JdbcTemplate

我有信心Spring Data and Spring Data JPA指的是相同的但后来我在 youtube 上观看了一个关于他正在使用JdbcTemplate在那篇教程中所以我在那里感到困惑我想澄清一下两者之间有什么区别Spring
归并排序中的递归：两次递归调用

private void mergesort int low int high line 1 if low lt high line 2 int middle low high 2 line 3 mergesort low middle l
Java中未绑定通配符泛型的用途和要点是什么？

我不明白未绑定通配符泛型有什么用具有上限的绑定通配符泛型 stuff for Object item stuff System out println item Since PrintStream println 可以处理所有引用类型通
应用程序关闭时的倒计时问题

我制作了一个 CountDownTimer 代码我希望 CountDownTimer 在完成时重新启动即使应用程序已关闭但它仅在应用程序正在运行或重新启动应用程序时重新启动因此如果我在倒计时为 00 10 分钟秒时关闭应用程序
将 JSON 参数从 java 发布到 sinatra 服务

我有一个 Android 应用程序发布到我的 sinatra 服务早些时候我无法读取 sinatra 服务上的参数但是在我将内容类型设置为 x www form urlencoded 之后我能够看到参数但不完全是我想要的我在
如何在 Maven 中显示消息

如何在 Maven 中显示消息在ant中我们确实有 echo 来显示消息但是在maven中我该怎么做呢您可以使用 antrun 插件
Windows 上的 Nifi 命令

在我当前的项目中我一直在Windows操作系统上使用apache nifi 我已经提取了nifi 0 7 0 bin zip文件输入C 现在当我跑步时 bin run nifi bat as 管理员我在命令行上看到以下消息但无法运行
Keycloak - 自定义 SPI 未出现在列表中

我为我的 keycloak 服务器制作了一个自定义 SPI 现在我必须在管理控制台上配置它我将 SPI 添加为模块并手动安装因此我将其放在 module package name main 中并包含 module xml 我还将其放
将2-3-4树转换为红黑树

我正在尝试将 2 3 4 树转换为 java 中的红黑树但我无法弄清楚它我将这两个基本类编写如下以使问题简单明了但不知道从这里到哪里去 public class TwoThreeFour
中断连接套接字

我有一个 GUI 其中包含要连接的服务器列表如果用户单击服务器则会连接到该服务器如果用户单击第二个服务器它将断开第一个服务器的连接并连接到第二个服务器每个新连接都在一个新线程中运行以便程序可以执行其他任务但是如果用户在第一个
JAVA - 如何从扫描仪读取文件中检测到“\n”字符

第一次海报我在读取文本文件的扫描仪中读取返回字符时遇到问题正在读取的文本文件如下所示 test txt start 2 0 30 30 1 1 90 30 0 test txt end 第一行 2 表示两个点第二行位置索引 0 xp

随机推荐

如何在 JavaScript 中填充 Angularjs $scope 变量？

mapApp controller myController function scope http scope namePlaceHolder Name scope name 我将范围变量绑定到 html 输入如下所示
带有图像的 iphone uipickerview

是否可以在 uipickerview 中添加一些图像图标而不是文本作为项目谢谢是的这是绝对可能的你需要处理 pickerView 委托方法 UIView pickerView UIPickerView pickerView vie
RoboMongo：不显示所有文档

当我打开集合时它仅显示前 50 个文档而不是全部文档如何使 RoboMongo 显示集合中的所有文档最好是自动罗博蒙戈结果 https i stack imgur com K5fn8 png 2019 年 12 月 6 日更新最
为什么即使参数作为命名参数传递，参数的顺序仍然保持不变？在 JavaScript 中

例如在Python中 def dfde name age print age print name print age dfde age 27 name dfd 输出如下 27 dfd 27 但 javascript 中的某些内容将输出如下
使用 jquery 迭代 JSON 对象

为什么以下不起作用在循环内当 myJSON 为空或不为空时它永远不会打印 url each parseJSON myJSON function key value alert value url 对于这个 JSON 结构 host f
Angular 生产构建中出现无效或意外令牌错误

chunk 0 runtime 06daa30a2963fa413676 js runtime 06daa30a2963fa413676 js map runtime 1 5 kB entry rendered chunk 1 main 9
IntelliJ IDEA 中查找方法/函数的快捷方式是什么？

I know that Ctrl N is to find classes and it is very useful But what about methods ctrl F12 cmd F12 on macOS will show a
可滚动Div，哪些元素可以看到

我们有一个带有 CSS 的可滚动 divhieght 40px 里面有多个LIheight 20px div li title I1 item1 li li title I2 item2 li li title I3 item3 li li
轮询时承诺异步等待

我正在尝试将使用承诺和轮询的函数转换为异步函数但我不太确定它是如何工作的我有这个 function myFunction return new Promise resolve gt stuff here var poll setIn
如何在 Bixby 输入视图中使用语音输入选择？

目前我设置了一个提示来收集用户的电子邮件它在选择输入视图中提供存储在用户配置文件中的选项但是如果用户通过语音与 Bixby 交互例如可能他们的手很忙是否有办法为这些选项提供别名以便用户只需说家庭即可获取家庭电子邮件或工
无锁算法中的 ABA

我明白了ABA http en wikipedia org wiki ABA problem问题但我无法理解的是他们说在语言中自动垃圾收集它可能不会展示所以我的问题是自动垃圾收集如何防止ABA问题的发生在java中是否可能如果可
连接错误 - SQLSTATE[HY000] [2002] 操作超时

我在从 Windows 2008 R2 应用程序服务器连接到也在 Windows 2008 R2 上运行的 MySQL 服务器时遇到问题 Laravel 应用程序报告错误 exception PDOException with messag
gnuplot 中的 output.png 不如提示 shell 中的图好

我经常绘制图表gnuplot提示 shell 如下所示 gunuplot gt plot sin x with linespoints pointtype 3 出现的数字很棒今天我将图表保存在 png文件像这样 gnuplot gt
我如何解决语义错误：“类没有名为..”的关联

我正在关注 symblog symfony2 教程的第 5 部分 http tutorial symblog co uk docs customising the view more with twig html 标题下主页博客和评论
是否可以在 gnuplot 中设置标签相对于键的位置？

我的情节的本质是这样的绝对的标签并不能真正发挥作用我无法限制 y 中的范围所以想知道是否有办法将我的标签文本包含在键内或将其相对于键放置即下面 set term png enhanced size 1024 768 set titl
运行时错误：范围自动筛选上的“1004”

我想用 VBA 做什么使用数组过滤表并删除行我的数组有 4 个元素在循环中更改为有 5 个不同的集合正在过滤的列有 5 个元素我只想得到 1 这是一个循环它将创建 5 个报告每个报告根据第 29 列过滤不同的元素如果在调试模
如何在调用处替换内联函数代码？

我想知道内联函数调用是如何被内联代码替换的我在一些书中读到编译器可能会将内联函数视为普通函数任何人都可以解释内联函数是如何工作的来自 C 常见问题解答 http www parashift com c faq lite inline
属性编辑器未向 PropertyEditorManager 注册：自定义标记调用时出错

调用我的时出现以下错误testtag jsp org apache jasper JasperException 无法将属性 att1 的字符串转换为类 javax servlet jsp tagext JspFragment 属性编辑器
缓动不适用于toggleClass() 或addClass()

我有一个在页面上显示和隐藏实用工具栏的功能我想将其动画化这不是动画类标志是空的 min 类只是更改背景图像以及实用工具栏的高度和绝对位置我究竟做错了什么 document ready function var ubar ccUt
为什么 Java BufferedReader() 不能正确读取阿拉伯文和中文字符？

我正在尝试读取一个每行包含英文和阿拉伯字符的文件以及另一个每行包含英文和中文字符的文件然而阿拉伯文和中文的字符无法正确显示它们只是显示为问号知道我该如何解决这个问题吗这是我用于阅读的代码 try String sCurrentLi

为什么 Java BufferedReader() 不能正确读取阿拉伯文和中文字符？

为什么 Java BufferedReader() 不能正确读取阿拉伯文和中文字符？ 的相关文章

随机推荐

热门标签

为什么 Java BufferedReader() 不能正确读取阿拉伯文和中文字符？的相关文章