我尝试将网站的 html 保存在字符串中。该网站具有国际字符(ę、ś、ć...),即使我将编码设置为与网站字符集相对应的 UTF-8,它们也不会保存到字符串中。
这是我的代码:
using (WebClient client = new WebClient())
{
client.Encoding = Encoding.UTF8;
string htmlCode = client.DownloadString("http://www.filmweb.pl/Mroczne.Widmo");
}
当我将“htmlCode”打印到控制台时,国际字符未正确显示,即使在原始 HTML 中它们显示正确。
任何帮助表示赞赏。
我有同样的问题。看起来client.DownloadString
不使用 UTF-8 对字符进行编码。使用client.DownloadData
并对返回的数据进行编码Encoding.UTF8.GetString
解决这个问题。
using (WebClient client = new WebClient())
{
var htmlData = client.DownloadData("http://www.filmweb.pl/Mroczne.Widmo");
var htmlCode = Encoding.UTF8.GetString(htmlData);
}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)