如何在 C# 中获得正确的 HTML 编码？

2024-04-17

我正在尝试从网络词典中获取某个单词的发音。例如，在下面的代码中，我想得到的发音good from http://collinsdictionary.com http://collinsdictionary.com

(HTTP Agility Pack此处使用）

static void test()
{
    String url = "http://www.collinsdictionary.com/dictionary/english/good";
    WebClient client = new WebClient();
    client.Encoding = System.Text.Encoding.UTF8;
    String html = client.DownloadString(url);
    HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
    doc.LoadHtml(html);
    HtmlAgilityPack.HtmlNode node = doc.DocumentNode.SelectSingleNode("//*[@id=\"good_1\"]/div[1]/h2/span/text()[1]");
    if (node == null)
    {
        Console.WriteLine("XPath not found.");
    }
    else
    {
        Console.WriteLine(node.WriteTo());
    }
}

我正期待着

&nbsp;(ɡʊd

但我最多能得到的是

&nbsp;(ɡ?d

如何做对呢？

问题不在于您对文本的解析，而在于控制台输出的问题。如果您从命令行应用程序执行此操作，则可以将控制台的输出编码设置为 unicode：

Console.OutputEncoding = System.Text.Encoding.Unicode;

您还需要确保控制台中的字体是支持 unicode 的字体。看到这个answer https://stackoverflow.com/a/5750227/573218了解更多信息。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

html

encoding

WebClient

htmlagilitypack

如何在 C# 中获得正确的 HTML 编码？的相关文章

如何在线程中调用带有多个参数的方法？

我正在构建一个 C 桌面应用程序如何在线程中调用采用多个参数的方法我有一个名为 Send string arg1 string arg2 string arg3 的方法我需要使用名为 SendingThread 的线程调用此方法有人
无法从 GetProcessId(.. hWnd) (pInvoke) 中提取 processID

我使用以下方法 DllImport kernel32 dll SetLastError true static extern int GetProcessId IntPtr hWnd 尝试获取正在运行的进程的 processId 我拥有的唯
为什么我使用的 KnownType 属性是错误的？

我正在尝试反序列化来自 google api 的 json 响应所以我想我应该定义几个类来帮助它 DataContract public class DetectionResult ResponseData DataMember Name
了解 C# 中的自签名证书

最近我遇到了这个c 代码 var dn new X500DistinguishedName CN appSettings CommonName OU appSettings OrganizationalUnit X500Distinguis
迭代时跳过相同的多重映射值

有没有什么好方法可以实现下面所需的输出而不必删除相同的值或创建另一个列表向量等我正在尝试将不同文档中找到的单词映射到其文档名称如所需输出中所示 include
div 中的内部 html 更改时触发事件

I have div对于一些信息填写为 innerHTML单击按钮目标是我想要 slideDown添加 div 中的文本时的 div 可以用 jQuery 来实现吗 Example div div 将文本添加到 div document
std::线程构造和执行

我在中找不到任何信息文档 http en cppreference com w cpp thread thread thread是否能保证线程对象构造完成后线程实际上正在运行换句话说是否可以保证线程构造函数完成后线程函数已经被执行一
字符串初始化的 gcc 诊断不一致

我正在使用 gcc 4 9 1 Mingw 并使用以下命令编译代码 gcc test c otest exe std c11 迂腐错误 Wall Wextra 此代码给出诊断 int main void char a 5 h e l l o
从 Dotnet Google API 获取用户电子邮件信息

我正在为 gData 和 Drive C API 开发两个独立的 Oauth2 实现分别将令牌信息存储在 OAuth2Parameters 和 AuthorizationState 中我可以刷新令牌并将其用于必要的 API 调用我正在
使用枚举作为常量表达式。哪个编译器是正确的？

以下代码使用枚举成员m作为常量表达式即作为模板参数该代码可以在 gcc 下编译但不能在 clang 下编译现场演示 http coliru stacked crooked com a 79f0d052864fec19 20live
开源 C# 套接字 (TCP + UDP) 库 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我对 NET 框架的标准套接字类感到头疼有人可以推荐一个高效的开源 C 套接字 TCP UDP 库来处理套接字消息吗使用 Kerry Jia
使用 Regex/C# 将转换为

奇怪的问题但我不会浪费时间解释为什么我需要这样做只是我需要这样做我有以下内容
std::atomic 将一对原子 int32 视为一个原子 int64？

我有一对 unsigned int32 std atomic
C# - 将指向 sockaddr 结构的 IntPtr 转换为 IPAddress

从 P Invoked 本机函数中我得到一个IntPtr http msdn microsoft com en us library system intptr aspx它指向一个sockaddr http msdn microsoft
iTextSharp - 如何将 PDFPRow 添加到 PDFPTable？

我想将 PDFPCells 数组添加到 PDFPRow 然后将 PDFPRow 添加到 PDFPTable 但我似乎无法在 PDFPTable 中找到为此的方法然而有一个 PDFPTable AddCell 有任何想法吗查看PdfPTa
如何让第一个字母像报纸风格一样推入段落

我创建了一些 CSS 来处理段落中的第一个字母看起来也更大如何使第一个字母向下并向左推这样它就不会高于该行本身并在需要时将其他行缩进到右侧见附图 text article color 000 text article first
辅助功能：推荐 SVG 和 MathML 的替代文本约定？

Overview HTML5 现在允许 http dev w3 org html5 markup syntax html svg mathml
使用 std::istream_iterator 限制 std::copy 的范围

我构建了一个最小的工作示例来展示我在使用 STL 迭代器时遇到的问题我在用着istream iterator读书floatss 或其他类型来自 astd istream include
模板编译错误 - 没有匹配的调用函数

我正在尝试将字符串转换为数字为此我找到了以下方法 include
C++ 中的编译器指令重新排序优化（以及阻碍它们的因素）

我已将代码缩减为以下内容这在保留我感兴趣的编译器输出的同时尽可能简单 void foo const uint64 t used uint64 t ar 100 for int i 0 i lt 100 i ar i some globa

随机推荐

如何在 Listview 绑定 Xamarin.Forms 内创建网格

如何使用数据绑定在 ListView 内创建网格我正在使用 Xamarin Forms 创建这个应用程序如果我不知道需要多少行和列如何在 ListView 绑定内动态创建网格这是我到目前为止所拥有的
如何在BehaviorSubject中设置默认值

可能是一个菜鸟问题如何为BehaviorSubject 设置默认值我有一个具有 2 个不同值的枚举 enum class WidgetState HIDDEN VISIBLE 以及发出状态的行为主体 val widgetStateEmi
使用 JMockit 模拟私有静态字段？

我有一个像下面这样的课程 class ClassA private static File myDir myDir is created at some stage private static String findFile final
预编译 JavaScript 模板以在项目构建时发挥作用

Update我想避免在客户端编译模板并在本地 ant 构建过程中编译它们也许像将 jQuery 和 jQuery 模板加载到 rhino 中传递 template 依次处理每个 jst 文件的内容并构建一个 templates js
GNU Make 获取父目标名称

在gnu make中有没有办法获取启动整个链的原始目标并将执行引导到当前配方 PHONY all clean common all common clean common common echo echo MAKECMDGOALS for
PreparedStatement缓存——它是什么意思（它是如何工作的）

例如我使用 c3p0 和一些定义的 maxStatements 来进行准备语句缓存这个缓存到底有什么作用它缓存什么样的数据在什么级别数据库应用程序从例子中理解它会很好例如我有一个查询从某个表中选择其中某个列现在我在未缓
来自 bash 脚本的电子邮件

bin bash MESSAGE Line one n MESSAGE MESSAGE Line two n MESSAGE MESSAGE Line three echo MESSAGE mail s test email protect
进入编辑模式时保持 UITableViewCell 背景颜色

我已经为所有 UITableViewCell 设置了背景颜色但是当我单击 UIBarButtonItem 编辑时删除和可拖动图标会扭曲背景颜色使其后面出现白色背景有没有办法解决如有必要我可以显示代码但这似乎是一个非常简单的
从 .xbindkeysrc 执行命令后退出终端

我正在尝试使用 xbindkeysrc 将命令绑定到密钥即该命令从 keepassxc 检索密码并将其作为标准输入回显到 openconnect 用于 VPN 连接命令最后关闭终端以下内容完成了所有这些工作并且有效 psswd
错误域=AVFoundationErrorDomain代码=-11800“操作无法完成。错误域=NSOSStatusErrorDomain代码=-16170“（空）”

我在聊天应用程序中使用 AVPlayer 但在选定的音频文件中遇到以下错误但音频文件在浏览器中正确播放错误域 AVFoundationErrorDomain代码 11800 该操作可以未完成 UserInfo NSUnderlying
iOS - UIProgressView 仅更新一次

我正在从 API 加载数据并使用 UIProgressView 来显示已加载的数据量在我看来 WillAppear 我使用 Reachability 来检查是否有互联网连接然后如果存在则在函数中调用以下行 10 次 self pe
填写记录中缺失的日期

我有一个收藏ProductViews productId 5b8c0f3204a10228b00a1745 createdAt 2018 09 07T17 18 40 759Z 我有一个查询用于获取特定产品的每日视图 ProductVie
在 Entity Framework Core 中使用 SQL 视图

例如我有这样的模型 public class Blog public int BlogId get set public string Url get set public BlogImage BlogImage get set publ
具有多个服务器的计划任务 - 单点责任

我们有一个 Spring JPA Web 应用程序我们使用两个运行应用程序并使用相同数据库的 tomcat 服务器您的应用程序要求之一是执行 cron 计划任务经过简短的研究我们发现 Spring 框架为 cron 作业提供了一个非
Struts2中ActionMapper、ActionProxy、ActionInitation、ActionContext对象的范围？

任何人都可以描述一下我的对象吗 ActionMapper ActionProxy ActionInvocation ActionContext在 Struts2 应用程序中创建由于我是 Struts2 框架的新手我对这些对象的范围感到非
AWS ElasticSearch：如何将策略应用于索引

我们有一个 AWS ElasticSearch 域正在向其中写入记录文档我现在已经在 Kibana 中创建了索引状态生命周期管理 ISM ILM 策略并且可以将该策略应用于 Kibana 中的索引现在我想在从处理索引写入的 J
从 Roslyn ClassDeclarationSyntax 获取类 FullName（包括命名空间）

我有一个来自 roslyn 语法树的 ClassDeclarationSyntax 我是这样读的 var tree SyntaxTree ParseText sourceCode var root CompilationUnitSyntax
d3.event 在去抖动函数内为 null

当尝试使用 mousemove 事件处理程序的去抖版本时 d3 event is null 我想使用d3 mouse此去抖动处理程序中的对象但是d3 event返回 null 并抛出错误我怎样才能访问d3 event在下面的代码中 a
匹配两个不同文件中最接近的值并打印特定列

大家好我有两个文件每个文件都有 N 列和 M 行 File1 1 2 4 6 8 20 4 8 10 12 15 5 7 9 11 File2 1 a1 b1 c5 d1 2 a1 b2 c4 d2 3 a2 b3 c3 d3 19 a
如何在 C# 中获得正确的 HTML 编码？

我正在尝试从网络词典中获取某个单词的发音例如在下面的代码中我想得到的发音good from http collinsdictionary com http collinsdictionary com HTTP Agility Pack

如何在 C# 中获得正确的 HTML 编码？

如何在 C# 中获得正确的 HTML 编码？ 的相关文章

随机推荐

热门标签

如何在 C# 中获得正确的 HTML 编码？的相关文章