我已经成功地在 python 中使用 Playwright 从页面中获取元素。我现在遇到了从嵌入到文档中的文档中获取元素的挑战iframe。举个例子,我用过w3schools 页面解释了<option> element,它在 iframe 中显示结果。我正在尝试检索此句柄<option>
iframe 中的元素。
获取页面上元素的“正常”方式page.querySelector()
未能获得elementHandle
,这只是打印<class 'NoneType'>
:
with sync_playwright() as p:
for browser_type in [p.chromium, p.firefox, p.webkit]:
browser = browser_type.launch(headless=False)
page = browser.newPage()
page.goto('https://www.w3schools.com/tags/tryit.asp?filename=tryhtml_option')
element = page.querySelector('select')
print(type(element))
browser.close()
我尝试首先显式获取 iframe 的句柄,但这会产生相同的结果(<class 'NoneType'>
):
with sync_playwright() as p:
for browser_type in [p.chromium, p.firefox, p.webkit]:
browser = browser_type.launch(headless=False)
page = browser.newPage()
page.goto('https://www.w3schools.com/tags/tryit.asp?filename=tryhtml_option')
iframe = page.querySelector('iframe')
element = iframe.querySelector('select')
print(type(element))
browser.close()
如何从 iframe 中获取内容?
事实证明我很接近,但为了正确获取 iframe,我需要调用contentFrame()
method.
返回引用 iframe 节点的元素句柄的内容框架,或者null
否则
Then, querySelector()
将返回相应的elementHandle
正好:
with sync_playwright() as p:
for browser_type in [p.chromium, p.firefox, p.webkit]:
browser = browser_type.launch(headless=False)
page = browser.newPage()
page.goto('https://www.w3schools.com/tags/tryit.asp?filename=tryhtml_option')
iframe = page.querySelector('iframe').contentFrame()
element = iframe.querySelector('select')
print(type(element))
print(element.innerHTML())
browser.close()
成功打印
<class 'playwright.sync_api.ElementHandle'>
<option value="volvo">Volvo</option>
<option value="saab">Saab</option>
<option value="opel">Opel</option>
<option value="audi">Audi</option>
注意:如果有多个 iframe,则在检索句柄时可以只使用一个属性。通过其获取 iframeid
在上面的例子中,例如使用
iframe = page.querySelector('iframe[id=\"iframeResult\"]').contentFrame()
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)