从文件中读取特殊字符 - Java

2024-02-04

我正在从具有以下属性的文本文件中读取数据：

编码：ANSI
文件类型：电脑

现在，该文件包含许多特殊字符，例如度数符号（°）等。我正在使用以下代码读取该文件：

File file = new File("C:\\X\\Y\\SpecialCharacter.txt");
BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(file), "UTF-8"));

如果文件编码是 ANSI，则上述代码无法正确读取特殊字符，例如：文件中的行：
“降低热量并煮沸直至产品内部温度达到 165°F”，reader.readLine()会输出：
“降低热量并煮沸直至产品内部温度达到 165°F”

当我将文件的编码更改为 UTF-8 时，该行按文件中的原样读取，而不会弄乱特殊字符。

我的问题是，数据在什么时候会变得混乱？当将数据存储在文件中时还是从文件中读取数据时？在记事本中打开文件会正确显示所有特殊字符。这是怎么发生的？

十六进制转储输出：

          -0 -1 -2 -3  -4 -5 -6 -7  -8 -9 -A -B  -C -D -E -F

00000000- 4C 6F 77 65  72 20 68 65  61 74 20 61  6E 64 20 73 [Lower heat and s]
00000001- 69 6D 6D 65  72 20 75 6E  74 69 6C 20  70 72 6F 64 [immer until prod]
00000002- 75 63 74 20  72 65 61 63  68 65 73 20  69 6E 74 65 [uct reaches inte]
00000003- 72 6E 61 6C  20 74 65 6D  70 65 72 61  74 75 72 65 [rnal temperature]
00000004- 20 6F 66 20  31 36 35 BA  46                       [ of 165.F       ]

“ANSI”不是一个特定的编码 - 它是一个整体收藏的编码。您需要使用right读取文件时的编码。例如，您完全有可能正在使用Windows-1252 http://en.wikipedia.org/wiki/Windows-1252编码，这意味着你may想尝试传入“Cp1252”作为编码名称。

事实上，您传递的是“UTF-8”isn't通常称为 ANSI 的编码之一。您需要找出文件使用的确切编码，然后在InputStreamReader范围。

我的问题是，数据在什么时候会变得混乱？当将数据存储在文件中时还是从文件中读取数据时？

假设编码能够表示您感兴趣的所有字符，只有当您读取文件时才会如此。基本上，您试图将其视为采用一种编码来读取，而实际上它采用的是另一种编码。记事本要么正在执行某种启发式编码检测，要么恰好使用正确的默认值对于这种特殊情况.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从文件中读取特殊字符 - Java 的相关文章

将 Spring Data 随机（嵌入式）Mongo 端口与 NoSQL JUnit @Rule 结合使用

我目前正在尝试编写一个使用 Spring Data Mongo 存储库的集成测试类我使用由提供的嵌入式 Mongo 实例de flapdoodle embed mongo依赖性 Spring Data 文档指定我们只需要将这个依赖项放入项
Java中构造函数中的长参数列表[重复]

这个问题在这里已经有答案了可能的重复重构具有太多 6 个以上参数的方法的最佳方法是什么 https stackoverflow com questions 439574 whats the best way to refactor a
在多个不同线程之间共享变量

我想在多个线程之间共享一个变量如下所示 boolean flag true T1 main new T1 T2 help new T2 main start help start 我想分享flag在主线程和帮助线程之间这是我创建的两个不
JavaFx ComboBox 绑定混乱

我有一个 I18N 实现它通过属性绑定 JavaFX UI 元素例如 def translateLabel l Label key String args Any Unit l textProperty bind createStrin
Maven 管理的 Java EE 应用程序中 JBoss 提供的库

这对我来说实际上不太可能但网上似乎没有关于将 JBoss 提供的依赖项导入 Maven 管理的 Java EE 应用程序以在其中部署的直接答案据我所知有两件事与这个问题有关那就是jboss as client外部就 JVM 而言
Spring Boot“没有可用消息”错误（状态 = 404），

我正在使用带有嵌入式 Tomcat 的 Spring Boot 当它启动时它会登录到控制台 s w s m m a RequestMappingHandlerMapping 将 home 映射到公共 java lang String co
为什么需要使用java.util.TimerTask的purge()？

Timer cancel 取消任务 Timer purge 从此计时器的任务队列中删除所有已取消的任务如果我不在这里使用 purge 会发生什么当计时器的任务队列已满时会发生什么除非您正在运行的计时器数量过多否则实际计时器行为不会发
访问 java jigsaw 模块中的资源文件[重复]

这个问题在这里已经有答案了我正在尝试从项目中的类访问 Eclipse 项目中的文件我需要将该项目声明为 jigsaw 模块才能从其他项目访问它但是通过这样做我无法再访问项目中的 example png 等文件这是我的项目结构 pr
JAXB、Marshal 的问题 - 无法封送类型“java.lang.String”

当我运行 marshal 操作时出现以下错误 javax xml bind MarshalException with linked exception com sun istack internal SAXException2 unab
Java中的String为什么是不可变的对象，但我在创建一个对象后仍然可以更改它的值？ [复制]

这个问题在这里已经有答案了如果我可以创建一个字符串并给它一个值这怎么可能呢然后我可以像这样简单地覆盖它的值 String a abc a def 我怎么可能改变的值a 我一定在这里遗漏了一些东西我知道每当创建 String 对象时
非法监控状态异常

如何将轮询线程传递给另一个线程进行处理程序执行在控制器类中该类具有 main 方法和线程池主类控制器 public static void main String args throws InterruptedException Ru
关于 mongodb java 驱动程序的困惑[重复]

这个问题在这里已经有答案了我是 MongoDB 的初学者我正在使用 JAVA 驱动程序来使用它我有以下代码 MongoClient client new MongoClient DB d client getDB world DBCo
使用 Hibernate 作为 ORM 机制的 Web 应用程序中的 L1 和 L2 缓存有什么区别？

我只想要一些有关使用 L1 缓存和 L2 缓存的标准用途的一般信息我很好奇因为我正在研究使用赤土陶器作为二级缓存的系统并且我发现它也有一级缓存 L1 缓存是每个 Hibernate 会话都存在的缓存并且该缓存不在线程之间共享该缓存
如何在 Spring Boot 中访问 application.properties 文件中定义的值

我想访问中提供的值application properties e g logging level org springframework web DEBUG logging level org hibernate ERROR loggin
如何从 Java 类调用 Kotlin 类

我需要将意图从 java 活动传递到 Kotlin 活动 Java活动ProfileActivity class Intent selectGameIntent new Intent ProfileActivity this kotlin
如何将捕获的图像写入/粘贴到文档文件？

我有一个场景我需要捕获图像并将它们一个接一个地写入到一个word文件中我已经编写了下面的代码但似乎不起作用请帮忙 Robot robot try robot new Robot BufferedImage screenShot ro
如何获取嵌套类型内部结构的所有类型？

我有一个函数如下 public void park List
jstack 是否停止在较新的 JDK8 版本上工作？

我惊讶地发现不知何故最近 jstack 停止了在较新的 JDK 8 上的工作我不确定这发生在哪个版本但我确实得到 36649 Unable to open socket file target process not respond
Android 布局崩溃

I use a XWalkView https crosswalk project org 加载网页和视频查看器 https github com Bilibili ijkplayer在我的应用程序中播放实时视频我希望 IjkVideoV
Java中如何对整数除法进行四舍五入并得到int结果？ [复制]

这个问题在这里已经有答案了我刚刚写了一个小方法来计算手机短信的页数我没有选择使用Math ceil 老实说它看起来很丑陋这是我的代码 public class Main param args the command line arg

随机推荐

Ivy：使用动态修订

我在理解如何使用动态修订版时遇到问题Ivy http ant apache org ivy 在我的 Java 项目中有效目前我有以下布局 lib a revision 1 0 0 status release dependencies
Powershell启动作业同步输出

我有一个启动作业的 powershell 脚本 start job scriptblock while true echo Running Start Sleep 2 然后它继续执行脚本的其余部分该工作是一种对该进程 PID 的监控工作
Apache 用户帐户无密码访问服务器 - Ubuntu

我有同样的问题this https stackoverflow com questions 9089350 rsync via php exec with ssh passwordless ssh login问题如果我再解释一遍我可以使
前向声明类成员的前向声明

是否可以前向声明一个在另一个前向声明的类中声明的类基本上我有这样的东西 A h class A struct B 现在我想声明另一个这样的类 Q h class A struct A B class Q A B Foo 不这是不可能的
在 WordPress 中获取类别 ID 数组？

cats get categories array order gt ASC orderby gt id hierarchical gt 0 hide empty gt 0 taxonomy gt edu year 我想生成一个变量其中包
当作为 *.a 静态库链接时，为什么“WinMain”无法解析？

给定一个简单的程序 include
如何将 PHPUnit 与 CodeIgniter 结合使用？

我读过并阅读过有关 PHPUnit SimpleTest 和其他单元测试框架的文章他们听起来都很棒我终于让 PHPUnit 与 Codeigniter 一起工作了感谢https bitbucket org kenjis my ciun
默认模板参数在部分特化上下文中的作用

我不清楚部分专业化背景下默认模板参数的交互以选择哪个是更好的匹配模板这个问题源于此中发布的代码answer https stackoverflow com questions 52565407 use of enable if to m
Jenkins Slave 问题 - 无效的流标头：099EACED

Jenkins 2 7 4 安装在 RedHat 服务器中并且通过选择通过在主服务器上执行命令来启动代理选项来配置 Linux 从站我们创建了一个 Shell 脚本它在 Jenkins 版本 2 7 4 中运行良好现在我们将 J
“这个”阴影是个好主意吗？

隐藏类变量的情况在 Java 中很常见 Eclipse 将愉快地生成以下代码 public class TestClass private int value private String test public TestClass int
将数据库设置从 application.ini 中取出并放入环境中

在基于 Zend 的应用程序的传统编码中数据库设置存储在 application ini 中这会存储每个应用程序的设置 StackOverflow 上是否有人探索过将数据库设置从 application ini 移动到环境中的可能性例
Picasso 库无法在 Android 上从 SD 卡加载图像

我从图像库的路径中获取一个文件并尝试将其加载到图像视图如下所示文件路径为 storage sdcard0 DCIM Camera 1436267579864 jpg 我也尝试传递 Uri 我也有 SD 卡的读取权限它最终在onErr
如何通过IP获取时区[重复]

这个问题在这里已经有答案了我有一个注册通过它我可以获得注册用户的IP地址我想通过用户的 IP 地址获取用户的时区就像在 jquery 中我们可以得到这样的结果jquery 中的时区 http pellepim bitbucket o
如何获取 .NET 中的资源监视器值？

我需要获取 Windows 7 资源监视器中的一些值特别是每个进程的内存使用情况 CPU 和带宽我研究了 PerformanceCounter 类但没有找到深入到进程级别的方法资源监视器正是我正在寻找的东西在你问之前我知道这是重
raise StopIteration 和生成器中的 return 语句有什么区别？

我很好奇使用之间的区别raise StopIteration and a return生成器中的语句例如这两个函数有什么区别吗 def my generator0 n for i in range n yield i if i gt 5
安装 pydev 时出错[重复]

这个问题在这里已经有答案了我安装了 eclipse 3 7 并且想从 help gt install new software 从 pydev org updates 安装 pydev 但我不断收到错误 An error occurred
Python描述符与属性[重复]

这个问题在这里已经有答案了我对何时使用属性和描述符感到困惑我读到属性是一个专门的描述符有人可以发布这是如何工作的吗您应该阅读有关描述符实际是什么的文档 Cliff s Notes 版本描述符是一种低级机制可让您挂钩正在访问的对象
Rails 5 资产未在生产中加载

我最近更新了 Rails 应用程序中的一些软件包但现在我的资产无法提供服务相反我收到以下错误 Failed to load resource the server responded with a status of 404 Not
制作 VB-dll 并将其加载到 C++ 应用程序中

我有一个问题已经困扰了整整一周但我自己无法解决我一直在谷歌搜索并在各种论坛中搜索我发现了很多这可能有用尝试过但没有没有成功如果有人有任何线索请帮助我我从外部源获得了许多用 VB 编写的类和函数我需要能够在 C 应用程
从文件中读取特殊字符 - Java

我正在从具有以下属性的文本文件中读取数据编码 ANSI文件类型电脑现在该文件包含许多特殊字符例如度数符号等我正在使用以下代码读取该文件 File file new File C X Y SpecialCharacter txt

从文件中读取特殊字符 - Java

从文件中读取特殊字符 - Java 的相关文章

随机推荐

热门标签