我目前有 2 个 JavaScript 变量,需要从中检索值。 HTML 由一系列没有 id/name 属性的嵌套 DIV 组成。是否可以使用 HTMLAgilityPack 从这些变量中检索数据?如果是这样,我将如何去做,如果不是需要什么,正则表达式?如果是后者,请帮助我创建一个正则表达式来允许我执行此操作。谢谢。
<div style="margin: 12px 0px;" align="left">
<script type="text/javascript">
variable1 = "var1";
variable2 = "var2";
</script>
</div>
我假设您正在尝试从网站上抓取此信息?最有可能的是您无法直接控制的?有几种方法可以做到这一点,我会从简单到困难(至少在我看来):
询问(网站的)所有者。大多数时候,他们可以让您直接访问信息,如果您好意地提出要求,他们可能会让您免费获得这些信息
您可以使用网页浏览器 http://msdn.microsoft.com/en-us/library/system.windows.forms.webbrowser.aspx控制,运行 javascript,然后解析 DOM 中的值。与 HttpWebRequest 相反,这允许将所有正确的值加载到页面上并进行抓取。有用的链接在这里。 http://msdn.microsoft.com/en-us/library/aa290341%28v=vs.71%29.aspx
窃取源代码Firebug. http://getfirebug.com/使用 Firebug 检查网站以查看从后台调用了哪些 URL。最有可能的是,它使用异步请求从 Web 服务检索更新的信息。使用 Firebug,您可以在 NET -> XHR 下查看此内容。查看请求和返回的值,然后您可以自己检索值并从源解析内容,而不是抓取页面。
我认为这可能是您正在寻找的信息,但如果没有,请告诉我,我可以澄清/修复答案
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)