我正在编写一个应用程序,试图确定页面上是否有广告。当前正在使用 python 通过 selenium webdriver 使用浏览器驱动。
我认为 iframe 内存在大量广告,并且我制作了一个循环来查看每个框架的内部
browser = webdriver.Chrome()
browser.get("http://cnn.com")
all_iframes = browser.find_elements_by_tag_name("iframe")
for iframe in all_iframes:
browser.switch_to_frame(iframe)
print(browser.page_source)
browser.switch_to_default_content()
browser.quit()
我想知道是否有任何一致找到的标签或标签参数,我可以在多个页面上使用它们来确定页面上是否有广告(页面上的 iframe 内部和外部)。我是否必须在每个框架内寻找诸如 doubleclick 或 adtech 或 adblade 等内容的实例?
或者我是否必须生成不同的规则来逐页检查?
有人知道广告如何在页面上显示吗?谢谢。
您可以通过广告服务器进行搜索。
http://pgl.yoyo.org/as/serverlist.php?hostformat=adblockplus
查看其他项目并了解它们如何处理相同的任务会很有帮助:
http://adblockplus.org/en/source
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)