BeautifulSoup 在
2023-12-04


这是我从这行 Python 代码中得到的结果

listm = soup.findAll('td',{'class':'thumb'})

当我迭代 listm 时,这是一个项目的示例......

<a href="/property-search/property-details/1021206?StrtNum=1507"><img alt="1507 BOSTWICK LN" src="/res/slir/w75-h57-c4:3/propertyimages/20120904/BB/DSCN0738.JPG"/></a>

然而,我真正想要的是“1507 BOSTWICK LN”内的<img alt=

我已经尝试过.get_text返回空白,我尝试过lista = soup.findAll('td',{'class':'thumb'},{'alt':'img'}),以及其他几种无法让我得到文本的变体。

我想让 BeautifulSoup 返回文本,或者正则表达式可以工作吗?我对 RE 的了解为零,任何意见将不胜感激!


尝试这个:

listm = soup.findAll('td',{'class':'thumb'})
for elem in listm:
    print elem('img')[0]['alt']

这应该找到img每个内的标签td并打印的值alt属性。

EDIT:

你不应该假设存在img标签。改为这样做:

listm = soup.findAll('td',{'class':'thumb'})
for elem in listm:
    imgs = elem('img')
    if imgs:
        print imgs['alt']
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

BeautifulSoup 在