处理包含“问号”(�) 的字符串时出现编码问题

2024-04-17

我正在解析响应中的一些网页内容HttpWebRequest.

该网页内容正在使用字符集ISO-8859-1当解析它并最终从响应中得到所需的单词时，我收到了string带有这样的问号�我想知道将其转换回可读的正确方法string.

所以，我尝试的是转换当前单词encoding into UTF-8像这样：

（我想知道是否UTF-8可以解决我的问题）

string word = "ESPA�OL";

Encoding iso = Encoding.GetEncoding("ISO-8859-1");
Encoding utf = Encoding.GetEncoding("UTF-8");

byte[] isoBytes = iso.GetBytes(word);
byte[] utfBytes = Encoding.Convert(iso, utf, isoBytes);

string utfWord = utf.GetString(utfBytes);

Console.WriteLine(utfWord);

然而，utfWord可变输出ESPA?OL这仍然是错误的。正确的输出应该是ESPAÑOL.

如果可能的话，有人可以给我正确的指示来解决这个问题吗？

有问题的词是“ESPAÑOL”。这可以在 ISO-8859-1 中正确编码，因为单词中的所有字符都是ISO-8859-1 中表示 http://en.wikipedia.org/wiki/ISO/IEC_8859-1.

您可以使用以下简单程序亲自查看这一点：

using System;
using System.Diagnostics;
using System.Text;

namespace ConsoleApplication1
{
    class Program
    {
        static void Main(string[] args)
        {
            Encoding enc = Encoding.GetEncoding("ISO-8859-1");
            string original = "ESPAÑOL";
            byte[] iso_8859_1 = enc.GetBytes(original);
            string roundTripped = enc.GetString(iso_8859_1);
            Debug.Assert(original == roundTripped);
            Console.WriteLine(roundTripped);
        }
    }
}

这告诉您，您需要正确诊断错误字符的来源。当你拥有 � 角色时，为时已晚。信息已丢失。 � 字符的存在表明，在某个时刻，执行了到不包含字符 Ñ 的字符集的转换。

从 ISO-8859-1 到 Unicode 编码的转换将正确处理“ESPAÑOL”，因为该单词可以用 ISO-8859-1 进行编码。

最可能的解释是，在此过程中的某个地方，文本“ESPAÑOL”被转换为不包含字母 Ñ 的字符集。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

encoding

UTF8

characterencoding

ISO88591

处理包含“问号”(�) 的字符串时出现编码问题的相关文章

无法将 std::min 传递给函数，std::min 的副本有效

Passing std min函数无法编译我复制了 libcpp 声明std min进入我的源文件并且它可以工作 std 版本有什么问题 clang 和 gcc 也会发生同样的情况在 Godbolt 上测试 https godbolt
锁定 ASP.NET 应用程序变量

我在 ASP NET 应用程序中使用第三方 Web 服务对第 3 方 Web 服务的调用必须同步但 ASP NET 显然是多线程的并且可能会发出多个页面请求从而导致对第 3 方 Web 服务的同时调用对 Web 服务的调用封装在自
叮当错误？命名空间模板类的朋友

以下代码在 clang 下无法编译但在 gcc 和 VS 下可以编译 template
进程退出后 POSIX 名称信号量不会释放

我正在尝试使用 POSIX 命名信号量进行跨进程同步我注意到进程死亡或退出后信号量仍然被系统打开在进程打开它死亡或退出后是否有办法使其关闭释放早期的讨论在这里当将信号量递减至零的进程崩溃时如何恢复信号量 https sta
将下拉列表与字典绑定

我将字典绑定到下拉列表举例来说我的字典中有以下项目 Test1 123 Test2 321 我希望下拉文本采用以下格式 Test1 Count 123 Test2 Count 321 我沿着以下路径走但没有运气 MyDropDown
带有运算符语法的错误消息，但不带有函数语法的错误消息

为什么我在调用 unary 时收到错误消息使用运算符语法如果我用函数语法调用它就可以了现场演示 https godbolt org z j7AbeQ template
为什么需要数字后缀？

C 语言我确信还有其他语言需要在数字文字末尾添加后缀这些后缀指示文字的类型例如 5m是一个小数 5f是一个浮点数我的问题是这些后缀真的有必要吗或者是否可以从上下文中推断出文字的类型例如代码decimal d 5 0应该推断
将日期时间转换为指定格式

我有这个日期格式yy MM dd HH mm ss ex 12 02 21 10 56 09 问题是当我尝试使用以下代码将其转换为不同格式时 CDate 12 02 21 10 56 09 ToString MMM dd yyyy HH
如何在win32中使用GetSaveFileName保存文件？

我编写此代码是为了获取 fileName 来保存我的文件 include stdafx h include
SQL Server默认字符编码

默认情况下 Microsoft SQL Server 中数据库的字符编码集是什么如何查看 SQL Server 中当前的字符编码编码 In most cases SQL Server stores Unicode data i e th
在 C# 中何时使用 ArrayList 而不是 array[]？

我经常使用一个ArrayList而不是正常 array 当我使用时我感觉好像我在作弊或懒惰 ArrayList 什么时候可以使用ArrayList在数组上数组是强类型的并且可以很好地用作参数如果您知道集合的长度并且它是固定的则
通过 C# Mailkit / Mimekit 发送电子邮件，但出现服务器证书错误

Visual Studio 2015 中的 0 代码 1 我正在使用 Mailkit 最新版本 1 18 1 1 从我自己的电子邮件服务器发送电子邮件 2 电子邮件服务器具有不受信任的自签名证书 3 我在代码中添加了以下两行以忽略服务器证
用于连接 DataTable 上的动态列的动态 LINQ

我目前遇到的情况不确定如何继续我有两个从数据库填充的数据表我还有一个可用的列名称列表可用于将这两个数据表连接在一起我希望编写一组 LINQ 查询这些查询将显示两个数据表中的行内部联接用于从一个数据表更新另一个数据表显示一个
为什么不能调用带有 auto& 参数的 const mutable lambda？

include
使用 xslt 将 xml 转换为 xsl-fo 时动态创建超链接？

我想使用 xsl 文件在 PDF 报告中创建标题如果源文件包含超链接则应将其呈现为超链接否则呈现为纯文本例如我的 xml 如下所示 a href http google com target blank This is the h
C 语言中的 Alpha 混合 2 RGBA 颜色[重复]

这个问题在这里已经有答案了可能的重复如何快速进行阿尔法混合 https stackoverflow com questions 1102692 how to do alpha blend fast 对 2 个 RGBA 整数颜色进行
有没有办法直接在函数参数中格式化字符串而不是使用临时字符串？

我有一个接受字符串字符数组作为参数的函数 void enterString char my string 当使用这个函数时我经常发现自己想要输入格式化的字符串我使用 sprintf 来做到这一点然而我每次都必须创建一个临时字符串
将 Swagger 与命名空间版本的 WebApi 结合使用

我已经找到了如何使用基于名称空间的 WebAPI 版本这个班 https aspnet codeplex com SourceControl changeset view dd207952fa86 Samples WebApi Namesp
如何在c linux中收听特定接口上的广播？

我目前可以通过执行以下操作来收听我编写的简单广播服务器仅广播 hello int fd socket PF INET SOCK DGRAM 0 struct sockaddr in addr memset addr 0 sizeof ad
嵌入式二进制资源 - 如何枚举嵌入的图像文件？

我按照中的说明进行操作这本书 http www apress com book view 9781430225492 关于资源等的章节我不太明白的是如何替换它 images Add new BitmapImage new Uri Ima

随机推荐

JavaScript 正则表达式 - g 修饰符不起作用[重复]

这个问题在这里已经有答案了我有以下代码 var str 4 shnitzel 5 ducks var rgx new RegExp 0 9 g console log rgx exec str chrome 和 firefox 上的输出是
如果Bokeh有很多图表，输出文件很重并且系统很慢

我使用散景我非常喜欢Bokeh 因为Bokeh有很多图表并且输出文件非常简单我在半导体公司工作有时我会分析半导体数据我有很多数据我制作了很多图表可能是 1000 4000 次图表操作我用Bokeh来制作图表但是Bokeh很
在 PowerShell 中检查路径是否存在的更好方法[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案 PowerShell 中是否有更简洁且不易出错的方法来检查路径是否不存在对于这样一个常见的用例来说客观上来说太冗长了 if not Test
Symfony2 创建自己的编码器来存储密码

我是 Symfony2 的新手我可能有一个关于在数据库中编码用户密码的简单问题我想以这种方式编码并存储在数据库中我的用户密码 encoded password salt sha1 salt raw password 我找到了各种编码器
是Pythonic吗：命名lambdas

我开始欣赏 python 中 lambda 表达式的价值特别是在函数式编程方面 map 函数返回函数 https stackoverflow com a 16509 1533474等等但是我也在函数中命名 lambda 因为我多次需
fseek() 按行而不是字节？

我有一个可以逐行解析大文件的脚本当它遇到无法处理的错误时它会停止通知我们解析的最后一行这真的是寻找文件中特定行的最佳唯一方法吗 fseek 在我的情况下不可用
ASP.NET 日期和时间选择器？

我将 ASP NET 2 0 与 SQL Server 2005 结合使用我希望用户选择日期和时间然后将这些值保存到数据库中在 VS 中我可以使用日历控件来获取日期但是处理用户选择的日期以及用户还必须从控件中选择的时间有什么好处
如何删除 Rmd 输出到 PDF 中代码块之间的空白？

如何删除图表末尾与下一个图表之间的多余空白我有一个闪亮的应用程序运行参数化的 Rmd 输出为 html 和 PDF html 很好但 PDF 中有太多空白我应该将所有内容都放入两页中因此边距几何形状很软但是我需要在第 1 页底
使用 LaTeX，如何在每个部分的末尾提供参考文献列表？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我想为每个部分生成参考书目并将其放在该部分的末尾当我现在这样做时它会生成完整的参考书目并将其放置在每个部分之后有没有办法可以做到这一点建议h
AFJSONRequestOperation 数组填充，但无法在成功块之外填充 NSLog 内容

以下代码摘自本教程 http mobile tutsplus com tutorials iphone ios sdk afnetworking 我以前用过这个片段但之前从未注意到这个问题数组内容的 NSLog 在委托方法中打印但不在
Socket IO 涉及磁盘 IO 吗？

如果一个进程通过套接字向同一台机器上的另一个进程发送数据传输过程中发生磁盘读写的可能性有多大似乎有一个套接字文件类型如果有空闲内存这些文件是否保证在内存中不直接 TCP UDP 网络套接字本地主机或 UNIX 域套接字将在内存
使用 NumPy 的数据类型大小

在 NumPy 中我可以通过以下方式获取特定数据类型的大小以字节为单位 datatype itemsize or datatype nbytes 例如 np float32 5 itemsize 4 np float32 5 nbyte
如何从给定 C# 链接的特定 GitHub 存储库中获取文件列表？

如何从 GitHub 链接获取文件列表例如来自此 GitHub 存储库链接 https github com crs2007 ActiveReport tree master ActiveReport SQLFiles 我们可以看到有S
自动执行 rake 任务以在 Heroku 上启动时运行？

假设有一个任务 rake startupscript 它应该在应用程序启动时运行我们如何在heroku上自动化它我知道有一个 heroku 调度程序但它会每 10 分钟运行一次任务而不是只在启动时运行一次我也知道Procfile
如何撤消“git add --intent-to-add”

当我跑步时git add intent to add 所有未跟踪的文件都从未跟踪的文件更改了状态 git status s showed 到未暂存提交的更改 git status s现在显示A 现在每当我跑步时git diff我也看
GNU Radio OOT 模块 AttributeError：“模块”对象没有属性“MME_cpp”

我知道这个问题以前曾被问过但我没有找到有用的解决方案完整的错误是 Executing home mint Documents test sensor cycl test top block py Using Volk machine a
如何标记条件编译的use语句？ [复制]

这个问题在这里已经有答案了是否可以将某些包含标记为仅包含在相关操作系统中例如你可以这样做 cfg unix use std os unix io IntoRawFd cfg windows https doc rust lang or
在有关资源、主题和章节的规范化数据库中使用 GROUP BY 进行 JOIN

我已经规范化了我的数据库但似乎无法以正确的方式返回我正在寻找的数据我有 5 张桌子资源 5 个资源主题 10 个主题章节 10 章主题到资源 18 个主题到资源链接主题到章节 18 个主题到章节的链接看看这个SQL小提琴 h
ASP.net：ClientScript.RegisterClientScriptBlock 在加载 jQuery 之前触发

我最近查看的一些继承代码中出现了有趣的问题我正在尝试向项目添加压缩模块它加载所有 JS 和 CSS 文件组合它们缩小它们并压缩它们我尝试了多种解决方案但它们都有一个致命的问题我有一些 javascript 通过 Master
处理包含“问号”(�) 的字符串时出现编码问题

我正在解析响应中的一些网页内容HttpWebRequest 该网页内容正在使用字符集ISO 8859 1当解析它并最终从响应中得到所需的单词时我收到了string带有这样的问号我想知道将其转换回可读的正确方法string 所以我尝试的

处理包含“问号”(�) 的字符串时出现编码问题

处理包含“问号”(�) 的字符串时出现编码问题 的相关文章

随机推荐

热门标签

处理包含“问号”(�) 的字符串时出现编码问题的相关文章