iconv:从 CP1252 转换为 UTF-8

2023-12-20

我正在尝试将 CP1252 编码的字符串 Çàïèñêè ýêñïåäèòîðà 转换为 UTF-8。我尝试过这个命令:

iconv -c -f=WINDOWS-1252 -t=UTF-8 test.txt

运气不好,得到了一些奇怪的结果:

�������...�

我尝试在这里输入相同的字符串 (Çàïèñêè ýêñïåäèòîðà),他们能够毫无问题地转换它:http://www.artlebedev.ru/tools/decoder/ http://www.artlebedev.ru/tools/decoder/

出了什么问题?


当你转换CP1252编码的字符串时Çàïèñêè ýêñïåäèòîðà使用命令转换为 UTF-8iconv.exe -f CP1252 -t UTF-8 test.txt >testout.txt然后是源文件test.txt(十六进制视图:

) 将被转换为目标文件testout.txt(十六进制视图:

) 这是 UTF-8 代码Çàïèñêè ýêñïåäèòîðà.

你放入的同样的垃圾也会从另一端出来。 iconv 的行为是正确的并且符合预期。

您感到困惑的是,您没有看到您所期望的内容,那是因为您输入的 8 位字符串实际上是编码在Windows-1251(西里尔字母)代码页 http://www.unicodetools.com/unicode/codepages.php?codepage=windows-1251.

→ So the correct code page is not CP1252 but CP1251

Command iconv.exe -f CP1251 -t UTF-8 test.txt >testout2.txt转换源文件test.txt进入目标文件testout2.txt(十六进制视图:

) 这是 UTF-8 代码Записки экспедитора这是您的用户期望看到的

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

iconv:从 CP1252 转换为 UTF-8 的相关文章

  • ruby2.0.0 在 windows 上安装 iconv 时出错

    ruby2 0 0 在 windows 上安装 iconv 时出错ruby2 0 0 在 windows 上安装 iconv 时出错我正在尝试安装 iconv 但是当我运行以下命令时 gem install iconv 我的结果 Tempo
  • 删除无效/不完整的多字节字符

    我在用户输入上使用以下代码时遇到一些问题 htmlentities string ENT COMPAT UTF 8 当检测到无效的多字节字符时 PHP 会抛出一个通知 PHP 警告 htmlentities path to file php
  • 是否可以将 gcc 编译的库与 MSVC 一起使用?

    我有一个项目依赖libiconv用于多项操作 我使用预编译的二进制文件iconv lib对于 Visual Studio 2008 但现在我必须转向 Visual Studio 2010 并且不再有可用的预编译二进制文件 我决定自己编译它
  • Linux 中从 EBCDIC 到 UTF8 的转换

    我已经使用 Perl 从我们的数据库 AS 400 DB2 导入了一个表 问题在于该字符串是用 EBCDIC Latin 1 意大利语 编码的 如何在 Linux bash 中将生成的文件转换为纯 utf 8 从 开始 iconv f EB
  • 如何使用 iconv 将存储为 LATIN1 ( sql ) 的西里尔字母转换为真正的 UTF8 西里尔字母?

    我有一个 SQL 转储文件 其中包含错误存储的西里尔俄语 WINDOWS 1251 文本 例如 应该正确显示为 过去我已经成功转换了sql文件 但是内存在我所做的事情和顺序上失败了 从逻辑上讲 这是有道理的 因为它存储在 LATIN1 中
  • 从 powershell 调用时 Iconv 正在转换为 UTF-16 而不是 UTF-8

    我在尝试在 powershell 脚本中使用 iconv 将某些文件的编码从 ISO 8859 1 批量转换为 UTF 8 时遇到问题 我有这个bat文件 工作正常 for f in txt do echo f C Program File
  • 如何将包含 HTML 实体和无效字符的文本转换为其 UTF-8 等效项?

    我正在更改标题 因为我不知道特殊的破损窗口字符给我带来了问题 使问题看起来像重复的 如何转换 HTML 实体 0 9 类型的字符引用和 a fA F0 9 无效的字符引用 和无效的 Windows 字符 chr 151 到其 UTF 8 等
  • 使用 find 和 iconv 更改文件名

    我尝试使用以下脚本更改文件名 find dir type f exec mv echo iconv f UTF8 t ASCII TRANSLIT 为什么不起作用 我的意思是 当我有一个带有 这样的字符的文件时 它应该将其转换为 a ech
  • iconv:从 CP1252 转换为 UTF-8

    我正在尝试将 CP1252 编码的字符串 转换为 UTF 8 我尝试过这个命令 iconv c f WINDOWS 1252 t UTF 8 test txt 运气不好 得到了一些奇怪的结果 我尝试在这里输入相同的字符串 他们能够毫无问题地
  • PHP DOM UTF-8 问题

    首先 我的数据库使用 Windows 1250 作为本机字符集 我将数据输出为 UTF 8 我在我的网站上使用 iconv 函数将 Windows 1250 字符串转换为 UTF 8 字符串 并且效果完美 问题是当我使用 PHP DOM 解
  • mySQL 和 PHP 编码

    您好 我对此查询有疑问 SELECT FROM table WHERE name LIKE t st HTML 和 SQL 表都有 utf 8 编码 但不幸的是没有mysql set charset utf 8 我是NOT能够使用它 我尝试
  • 为什么 iconv 命令输出到同一文件会被截断?

    现在我有一些 euc jp 编码的文件需要转换为 utf 8 编码 所以我在 bash 中使用 iconv 命令 iconv foo c f euc jp t utf 8 o foo c 但是出现了一个问题 它说 usr bin iconv
  • 如何为 android ndk 安装 libiconv?

    有人可以教我或给我指点如何为 Android 安装 libiconv 的教程吗 我已经用谷歌搜索了三天 但找不到教程或操作方法 获取 libiconv 源代码 并创建 Android mk makefile 看着这个网站 http grou
  • Twitter 中的表情符号 R 中的情感分析

    如何处理 摆脱表情符号 以便我可以对推文进行排序以进行情感分析 得到 sort list y 中的错误 输入无效 Thanks 这就是从 twitter 到 r 的表情符号的显示方式 xed xed u0083 xed xed xed xe
  • iconv 返回奇怪的结果

    我正在研究一种方法来解决在 PHP 中创建帐户的自动脚本中使用特殊字符的问题 由于电子邮件地址和其他地方不需要特殊字符 因此我试图删除它们 但在将它们提供给脚本之前我无法删除它们 因为用户名必须正确显示给其他用户 例子 J rgen G t
  • 将 unicode 字符编码为 un​​icode 转义序列

    我有一个包含网站和地址的 CSV 文件 我需要处理这个文件来生成一个 json 文件 我将在 Django 中使用该文件将初始数据加载到我的数据库中 为此 我需要将 CSV 文件中的所有特殊字符转换为 unicode 转义字符 这是一个例子
  • libiconv 和 MacOS

    我正在尝试在 Mac OS X Lion 中编译 GCC 4 5 1 我的 libiconv 有问题 首先 它抱怨架构 x86 64 的未定义符号 它们是 iconv iconv open 和 iconv close 我发现 MacPort
  • 强制从 US-ASCII 编码为 UTF-8 (iconv)

    我正在尝试将一堆文件从 US ASCII 转码为 UTF 8 为此 我使用 iconv iconv f US ASCII t UTF 8 file php gt file utf8 php 我的原始文件是 US ASCII 编码的 这使得转
  • PHP,将 UTF-8 转换为 ASCII 8 位

    我正在尝试使用以下命令将字符串从 UTF 8 转换为 ASCII 8 位iconv功能 该字符串旨在导入到会计软件中 根据 SIE 标准解析一些基本指令 我现在正在运行的 iconv UTF 8 ASCII this gt output 这
  • 与 Ruby 1.9.X 中的 Iconv.conv("UTF-8//IGNORE",...) 等效吗?

    我正在从远程源读取数据 偶尔会得到另一种编码的一些字符 它们并不重要 我想得到一个 最佳猜测 utf 8 字符串 并忽略无效数据 主要目标是获得一个我可以使用的字符串 并且不会遇到以下错误 编码 UndefinedConversionErr

随机推荐

  • 如何在多个文件中导入常量

    我有一个包含许多模块的包 每个模块都使用我在每个文件中独立定义的常量 然而 所有这些常数必须彼此一致 所以我尝试在单个文件中定义它们并将其导入每个文件中 当我运行它时 出现未找到常量的错误 他们是让许多其他人导入单个文件并包含常量的干净方法
  • 在 JavaScript 中将 DOM 节点或文档转换为 XML

    假设您在 JavaScript 中收到一个 DOM 元素或文档 例如 window document 您如何将其转换为有效的 XML 更具体地说 对于我的示例 我有一个显示 SVG 的网页 该 SVG 有大量 JavaScript 来允许交
  • Python、tkinter 和导入的类:记录未捕获的异常

    我正在编写一些想要与我的团队共享的脚本 因此我一直在构建一堆日志记录 以便在他们在某个地方遇到崩溃时更容易进行调试 从那时起我就可以看到到底发生了什么崩溃 一般记录到文件没有问题 但我有一个未捕获的异常问题 我尝试了各种方法来让它工作 例如
  • 程序集中的类顺序

    什么决定了程序集中类的顺序 还有 有办法改变它吗 附加信息 您可以自己通过反射检查顺序 也可以使用ILDASM之类的工具 禁用字母排序 然后您也会得到顺序 顺序似乎是由编译器以一种奇怪的方式确定的 我已经尝试了一些事情 例如重命名类 顺序保
  • cakephp 中在哪里定义常量

    我应该在哪个文件中定义特定于我的 cakephp 应用程序的应用程序范围常量 我在 app config bootstrap php 中定义它们 引导 CakePHP 如果您有任何其他配置需求 请使用 CakePHP 的引导文件 该文件位于
  • JBoss 4.2.2 节点开始集群然后互相怀疑

    我有一个在现有 Red Hat 服务器上运行 JBoss 4 2 2 的网站 我正在设置第二台服务器 以便拥有一对集群 然后将进行负载平衡 但是 我无法让它们成功集群 现有服务器启动 JBoss run sh c default b 0 0
  • xslt apply-templates 选择所有剩余的文本节点

    我有这个简化的 xml a b b a
  • 在 C++ 应用程序中使用纯 C(非类包装)函数时是否存在任何问题?

    我计划在 C 应用程序中使用纯 C MPI 库 我不想通过运行例如添加不必要的膨胀 Boost MPI 层将所有内容包装在MPI
  • 如何在Flutter中更改按钮主题的文本颜色

    如果我向我的应用程序添加一个主题 如下所示 class MyApp extends StatelessWidget override Widget build BuildContext context return MaterialApp
  • 使用 _renderItem 类型会破坏自动完成字段

    我有一个 jQuery 自动完成字段 到目前为止一直运行良好 我决定使用 renderItem因为我想在结果中使用一些 HTML 这是我的代码 function prepareClientField var renderItemFuncti
  • Android 中的*窗口焦点*什么时候会改变?

    在我的项目中 我需要捕捉窗口焦点的变化 我已经注销了活动所有阶段的结果 当屏幕亮起时 结果如下 02 17 13 50 03 898 DEBUG InquiryInterface 3829 onCreate screen state fal
  • Java HashMap 调整大小的时间复杂度

    我想知道时间复杂度是多少Java HashMap当负载因子超过阈值时调整大小 据我了解 HashMap 的表大小始终是 2 的偶数次幂 因此每当我们调整表大小时 我们不需要重新散列所有键 如果我错了 请纠正我 我们需要做的就是是分配额外的空
  • 如何将Sentry与.NET 6.0 Worker Service集成?

    我综合了Sentry与 NET Core 6 0工人服务这边走 NuGet 哨兵3 17 1 Program cs using Sentry var sentryDsn Environment GetEnvironmentVariable
  • 处理宏注释时无法访问父级成员

    我有点被以下内容挡住了 宏注释 情况 假设我有一个名为 factory哪个 旨在产生一个apply相应伴随对象中带注释的特征的方法 例如 给定trait A factory trait A val a1 Int 预期生成的代码如下 obje
  • 扩展模板解析器:CodeIgniter...嵌套数组的问题

    我目前正在使用扩展模板解析器库 http codeigniter com forums viewthread 155859 对于代码点火器 我在尝试模板解析嵌套数组时遇到了问题 这是我正在向视图提供的数组 Array users gt Ar
  • 如何从 C++ 向量中获取 2 个随机(不同)元素

    我想从 std vector 中获取 2 个随机不同的元素 我怎样才能做到这一点 它很快 在我的算法中已经完成了数千次 它是优雅的 元素选择确实是均匀分布的 为了优雅和简单 void Choose const int size int fi
  • 如何为复杂的文档结构编写 MongoTemplate 查询和条件?

    我是 MongoTemplate 的新手 我想定义一个 org springframework data mongodb core query Query 和 org springframework data mongodb core qu
  • Makefile 和符号链接

    我在 makefile 方面遇到了一个奇怪的问题 我只想在 makefile 中设置符号链接 但在一台机器上收到错误消息 Linux 2 6 18 238 12 1 el5 make execvp ln Too many levels of
  • 如何在 Cocoa Mac 中以编程方式关闭窗口?

    如何以编程方式关闭 cocoa mac 中的窗口 我使用按钮单击从第一个窗口 xib 打开了第二个窗口 xib 我需要在打开或单击按钮时以编程方式关闭第一个窗口 xib 我怎样才能做到这一点 Apple 有一些有用的示例代码笔尖装载 htt
  • iconv:从 CP1252 转换为 UTF-8

    我正在尝试将 CP1252 编码的字符串 转换为 UTF 8 我尝试过这个命令 iconv c f WINDOWS 1252 t UTF 8 test txt 运气不好 得到了一些奇怪的结果 我尝试在这里输入相同的字符串 他们能够毫无问题地