HttpWebRequest：使用正确的编码接收响应

2023-11-30

我当前正在使用以下代码下载 HTML 页面：

Try
    Dim req As System.Net.HttpWebRequest = DirectCast(WebRequest.Create(URL), HttpWebRequest)
    req.Method = "GET"
    Dim resp As Net.HttpWebResponse = DirectCast(req.GetResponse(), Net.HttpWebResponse)
    Dim stIn As IO.StreamReader = New IO.StreamReader(resp.GetResponseStream())
    Dim strResponse As String = stIn.ReadToEnd

    ''Clean up
    stIn.Close()
    stIn.Dispose()
    resp.Close()

    Return strResponse

Catch ex As Exception
    Return ""
End Try

这对于大多数页面都适用，但对于某些页面（例如：www.gap.com），我得到的响应编码不正确。
例如，在gap.com 中，我将“’”视为“？”
更不用说如果我尝试加载 google.cn 会发生什么......

为了让 .Net 正确编码，我在这里缺少什么？

我最担心的是，我实际上必须读取指定编码的 HTML 内的元标记，然后重新读取（重新编码？）整个流。

任何指示将不胜感激。

UPDATE:

感谢约翰·桑德斯的回复，我距离更近了一些。 HttpWebResponse.ContentEncoding 属性似乎总是为空。然而，HttpWebResponse.CharacterSet 似乎很有用，通过这段代码，我越来越接近：

Dim resp As Net.HttpWebResponse = DirectCast(req.GetResponse(), Net.HttpWebResponse)
Dim respEncoding As Encoding = Encoding.GetEncoding(resp.CharacterSet)
Dim stIn As IO.StreamReader = New IO.StreamReader(resp.GetResponseStream(), respEncoding)

现在Google.cn 完美地出现了，所有的汉字都显示出来了。
然而，Gap.Com 仍然犯了错误。

对于 Gap.com，HttpWebResponse.CharacterSet 是 ISO-8859-1，我通过 GetEncoding 获得的编码是 {System.Text.Latin1Encoding}，其主体名称中显示“ISO-8859-1”，并且内容-在 HTML 中键入 META 标记指定“charset=ISO-8859-1”。

我还是做错了什么吗？
还是GAP做错了什么？

我相信 HttpWebResponse 有一个 ContentEncoding 属性。在 StreamReader 的构造函数中使用它。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

HttpWebRequest：使用正确的编码接收响应的相关文章

MySQL 不将 ı 视为 i？

我在 MySQL 5 7 27 中有一个用户表utf8mb4 unicode ci整理不幸的是没有像 i 那样进行线程化以下查询将找不到Y lmaz select id from users where name Yilmaz 我对其
ASIHTTPRequest：检测到不正确的 NSStringEncoding 值 0x0000

检测到不正确的 NSStringEncoding 值 0x0000 假设 NSStringEncodingASCII 将停止此兼容性映射行为不久的将来当我使用 ASIHTTPRequest 时我不断收到此错误 50 的时间这是怎么回
如何在 Java/Eclipse 中使用特殊字符

如何在 Java Eclipse 中使用显示或等字符当我尝试直接使用它们时例如在源代码中 Eclipse无法保存文件我能做些什么编辑如何找到 unicode 转义序列问题是您使用的字符无法以文件设置的编码 Cp1252 表
Encoding.RegisterProvider(CodePagesEncodingProvider.Instance) 不添加额外的编码提供程序

我正在开发一个netcoreapp2 0控制台应用程序我需要从 NET 访问整个编码包我已经添加了System Text Encoding CodePages Version 4 4 0Nuget 包来自这一页 https www nu
使用 utf-8 的 Java BufferedWriter 对象

我有以下代码我想让输出流使用 utf 8 基本上我有这样的角色显示为 233 所以看起来像是编码问题我见过很多使用的例子 OutputStreamWriter out new OutputStreamWriter new FileO
定义Python源代码编码的正确方法

PEP 263 http www python org dev peps pep 0263 定义如何声明Python源代码编码通常 Python 文件的前两行应以以下内容开头 usr bin python coding
ruby 中的 #encode 和 #force_encoding 有什么区别？

我真的不明白之间的区别 encode and force encoding在 Ruby 中String班级我明白那个 kam force encoding UTF 8 将迫使 kam 是UTF 8编码但是怎么样 encode encod
异步回调在哪个线程上运行？

我正在做几个HttpWebRequest BeginGetResponse调用并在回调方法中BeginGetResponse 我正在调用一个事件处理程序在EventHandler中有测试下载是否成功的逻辑如果没有它会尝试重新下载
如何纠正 data.frame 上的字符编码

我有一个像这样的数据框 data names lt data frame DATA c 1 5 rownames data names lt c IV xc1N JOS xc9 LUC xcdA RAM xd3N TO xd1O data
R在Windows平台Rstudio上打印data.frames中的UTF-8代码

当数据框中存在UTF 8字符时将无法正常显示例如以下内容是正确的 gt U6731 1 朱但是当我将其放入数据框中并打印出来时它是 gt data frame x U6731 x 1
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
文件是通过 Visual Studio 下载的，但不是通过 .exe 下载的

当我尝试下载 a 时出现以下错误 pdf通过我的网址从文件 exe file 服务器违反了协议部分响应头详细信息 CR 后必须跟 LF 但当我尝试从 Visual Studio 调试代码时也会下载同样的内容我完全迷失了不知道发生
charset-utf8 和字符实体

我建议将我的 windows 1252 XHTML 网页转换为 UTF 8 我的编码中有以下字符实体 39 撇号 9658 右指针 9668 左指针如果我使用编辑器更改字符集并将页面保存为 UTF 8 撇号保留为字符实体指针被转换为代码
如何强制jar使用（或jar运行的jvm）utf-8而不是系统的默认编码

我的Windows默认编码是GBK 而我的Eclipse完全是utf 8编码因此在我的 Eclipse 中运行良好的应用程序崩溃了因为导出为 jar 文件时这些单词变得不可读我必须在 bat 文件中写入以下行才能运行该应用程序 st
整数的 ASN.1 / DER 编码

我目前开始使用 DER 杰出编码规则编码并且在理解整数编码时遇到问题在参考文档中https www itu int ITU T studygroups com17 languages X 690 0207 pdf https www
土耳其语字符显示不正确[重复]

这个问题在这里已经有答案了 MySql 数据库使用 utf 8 编码数据存储正确我使用 set name utf8 查询来确保调用的数据是 utf 8 编码只要标头字符集是 utf 8 数据库中的所有变量都可以正常工作但静态html
.NET 4.0 代码可以与 .NET 2.0 代码互操作吗？

NET 4 0 程序集调用 NET 2 0 程序集中的代码是否存在兼容性障碍反之亦然更具体地说我正在研究在使用基于 NET 2 0 的第三方应用程序时升级到 Visual Studio 2010 该应用程序可通过引用我的自定义代码的挂
.NET Framework 2.0 Service Pack 1 中新增的类型

我以为 NET 2 0 SP1 中只有错误修复没有新类型直到我遇到few http davesbox com archive 2008 08 25 new for visual studio 2008 sp1 and fxcop 1 3
Web请求编码问题

您好我遇到以下代码的编码问题有什么想法吗 string url http www google com ig api weather istanbul TR hl tr HttpWebRequest request WebRequest
使用带有 HTTPS 证书的 System.Net.WebClient

在我的 C Windows 客户端中我向母舰进行了 POST 提交当然我希望提交的数据受到保护因此我付费让 HostGator 向我颁发 SSL 证书我保存了 CER 文件并且正在构建请求如下所示 wrapper for

随机推荐

Unity2D：缩放游戏对象而不缩放其子对象

我有一个敌人里面有孩子敌人也有死亡动画在死亡动画中使用动画师我将敌人缩放到适当的大小然而敌人内部的孩子也被缩小即使我在孩子上有一个动画我已经调整了它的大小我还在这个孩子上添加了锚点位置有没有办法既能缩小敌人的规模又能
Azure 事件中心 - 异地恢复：它是否复制到次要区域？

根据微软的文章 https learn microsoft com en us azure event hubs event hubs geo dr 根据设计事件中心异地灾难恢复不会复制数据因此您无法在辅助事件中心上重复使用主事件中心的
Node.js 错误：找不到模块“请求”

好的这是一个常见的错误我已经读过这篇文章node js 找不到模块请求请求模块安装在我的node modules中我的完整节点应用程序是 var r require request var s r http www foo com
PowerShell：GetNewClosure() 和带验证的 Cmdlet

我试图了解 GetNewClosure 如何在 PowerShell 2 中的脚本 cmdlet 上下文中工作本质上我有一个返回对象的函数如下所示 function Get AnObject param CmdletBinding P
如何处理删除函数中的 GORM 错误？

我有这个功能 var db gorm DB func DeleteCategory id uint error var category Category category ID id result db Delete category f
运行 chrome 扩展并在页面加载时将数据提交到 PHP 脚本（自动化该过程）

我第一次使用 chrome 扩展进行网络爬行我在 HTML 弹出窗口中获取数据然后在单击按钮时将其提交给 PHP 脚本现在我想在页面加载时执行此功能因此页面加载数据将被收集并将其提交给 PHP 脚本我正在使用如下扩展清单 js
如何在Android中使用intentservice同时下载多个文件？

我想创建一项与此类似的服务参考来自Here 在 Android 中异步下载多个文件 public static class DownloadingService extends IntentService public static St
线程中的 QTimer - 事件未处理？

我有一个从 QThread 派生的对象类定义包括 Q OBJECT 宏我在线程中创建了一个计时器这样我就可以在线程运行时偶尔进行一些检查但是超时事件从未发生我也尝试过将计时器设为单次但没有发出任何事件默认情况下事件是在线程中
php 驱动程序 mongodb ，从未加载

我已经安装了 MongoDB wamp 服务器并且在 MongoDB 中添加了一个集合然后我从下载了 php mongo 1 6 8 zipS3 gt 确定 zip 文件中有很多文件但我需要哪一个 Windows 10 64 位我找
iOS 中的透明环

我的视图中有一个圆形头像我这样做是这样的 self imageView layer cornerRadius 75 self imageView layer masksToBounds YES self imageView layer b
自动 gmail 登录 [在 oAuth 期间] 因用户验证而被阻止

此代码用于登录 Gmail public void login User user WebDriverWait wait new WebDriverWait driver 60 WebElement emailTextBox wait un
如何正确地将元组序列化为键字典

我有以下应用程序显示字典的关键部分未发送到JsonConverter 但它被称为ToString 在这对我来说是一个问题因为我无法反序列化我的Json细绳有任何想法吗 class Program static void Main s
最好的通用 SVN 忽略模式？

最好的或尽可能好的通用 SVN 忽略模式是什么有许多不同的 IDE 编辑器编译器插件平台等特定文件和一些重叠的文件类型即某些类型的项目需要而其他类型的项目不需要然而无论您的开发环境的具体情况如何您永远都不希望将大
如何停止 Flex Canvas 上的子元素触发 Mouse Out 事件

我正在使用 Canvas itemRenderer 作为用于显示图像的容器请参阅下面的伪代码 image new Image image source data thumb this addChild image this addEven
令人困惑的 python 星号表示法的双重使用（作为函数参数，或作为函数定义）

我有点困惑让我们创建一个名为 x 的函数我知道通过在 y 之前添加这意味着我们可以添加任意数量的参数 def x y return y 然而 Case 1 gt gt gt x 1 2 1 2 Case 2 让我们传递一个前面带有星号
Oracle XSLT：默认命名空间导致空标签

我认为提出这个问题的最好方法是如何为输出中的根元素指定默认命名空间这样做
如何在实体表单中包含来自另一个实体的某些字段？

我想在一种表单中使用几个实体的字段可以吗例如我想添加到一个表单surname字段来自ProfileType类型和name字段来自CountryType 该字段必须是一个简单的字符串 text 我该怎么做谢谢 NOTE 我不能使用en
Flask-Session 无法从 itsdangerous 导入 Want_bytes

我正在使用 Flask Session 最近安装或升级到了 itsdangerous 1 0 0 现在我得到了错误ImportError cannot import name want bytes 为什么会发生此错误以及如何修复它 from
如何在xslt文件中调用外部java函数？

我有这个 xslt 文件我需要调用放置在同一应用程序中其他位置的 java 函数在 xslt 文件中我有
HttpWebRequest：使用正确的编码接收响应

我当前正在使用以下代码下载 HTML 页面 Try Dim req As System Net HttpWebRequest DirectCast WebRequest Create URL HttpWebRequest req Metho

HttpWebRequest：使用正确的编码接收响应

HttpWebRequest：使用正确的编码接收响应 的相关文章

随机推荐

热门标签

HttpWebRequest：使用正确的编码接收响应的相关文章