从下拉选项值中抓取 Python BeautifulSoup

2023-12-03

我尝试使用 BeautifulSoup 通过输入下拉菜单从网络上抓取数据

这是价值下降

<selected name="try">
<option value="G1">1</option>
<option value="G2">2</option>
</selected>

我尝试这样

soup = BeautifulSoup(url, 'html.parser')
soup['selected'] = 'G1'
data = soup.findAll("table", {"style": "font-size:14px"})
print(data)

它将获取数据<table>标记每个提交下拉列表

但它只出现<table>对于主页,如何从每个下拉列表中获取数据?


Try an 属性CSS 选择器

soup.select('option[value]')

The []是一个属性选择器。这寻找option标签元素与value属性。如果有一个可以使用的父类/id,那么在页面上有更多可用下拉列表的情况下会很有帮助。

items = soup.select('option[value]')
values = [item.get('value') for item in items]
textValues = [item.text for item in items]

与父母一起name属性限制为一个下拉列表(希望 - 您需要测试并查看是否需要进一步的操作来充分限制)。与使用后代组合器:

items = soup.select('[name=try] option[value]')
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

从下拉选项值中抓取 Python BeautifulSoup 的相关文章

随机推荐