例如,如果我想从此页面设置索引值:http://ca.finance.yahoo.com/q;_ylt=Agfc5O8HHTlOLgX.q6V4HEtyzJpG;_ylu=X3oDMTFkdnZqMHBkBHBvcwMyBHNlYwN5ZmlNYXJrZXRTdW1tYXJ5RnJvbnRwYWdlBHNsawNzcHRzeA--?s=^GSPTSE
到一个变量,我该怎么做?
我对编程非常陌生,如果您解释每一行,我将非常感激。
我的目的不是完成它,我想理解它。
预先非常感谢您!
如果你查看网页的源代码,你会发现索引号位于一个具有唯一id的span标签内:<span id="yfs_l10_^gsptse">13,702.33</span>
.
这意味着您可以抓取页面,然后挑选出该单独的标签。
您需要首先连接到主机并下载页面。执行此操作的方式取决于您使用的语言。有很多教程 - 只需搜索“[语言]网络抓取”即可。
然后您需要从 html 源代码创建一个文档对象模型 - 同样,这取决于语言,在某些语言中很容易,在另一些语言中则很困难。完成此操作后,只需搜索 id 为的标签即可yfs_l10_^gsptse
并抓取内容。
希望有所帮助 - 显然我还没有说很多,但这取决于你想使用什么语言。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)