我想检索的 href 属性<h3>
html页面的标签,我能够获取innerText,但我不知道如何访问href属性,有几个<h3>
文档中的标签,但目前我只需要第一个。剩下的我稍后再处理...
这是我到目前为止得到的代码
Sub Scrap()
Dim IE As New InternetExplorer
Dim sDD As String
Dim Doc As HTMLDocument
IE.Visible = True
IE.navigate "https://www.oneoiljobsearch.com/senior-reservoir-engineer-jobs/?page=1"
Do
DoEvents
Loop Until IE.readyState = READYSTATE_COMPLETE
Set Doc = IE.document
sDD = Trim(Doc.getElementsByTagName("h3")(0).innerText)
'sDD contains the string "Senior Reservoir Engineer"
End Sub
以下是要从中提取数据的 HTML 文档的一部分:
<div class="front_job_details">
<h3>
<a href="/jobs/senior-reservoir-engineer-oslo-norway-7?cmp=js&from=job-search-form-2" target="_blank">
Senior Reservoir Engineer
</a>
</h3>
我需要检索的文本是:“/jobs/senior-reservoir-engineer-oslo-norway-7?cmp=js&from=job-search-form-2”
在此先感谢您的帮助。
Try,
dim hr as string
hr = Doc.getElementsByTagName("h3")(0).getElementsByTagName("a")(0).href
debug.print hr
getElementsByTagName 集合是从零开始的,但 .Length(H3 的编号,在其他方法中称为 Count)是从一开始的。
dim i as long
for i=0 to Doc.getElementsByTagName("h3").length - 1
debug.print Doc.getElementsByTagName("h3")(i).getElementsByTagName("a")(0).href
next i
这会从每个 H3 获取第一个 标签。您可以复制该方法以从每个 H3 中获得多个 A。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)