这是我从这行 Python 代码中得到的结果
listm = soup.findAll('td',{'class':'thumb'})
当我迭代 listm 时,这是一个项目的示例......
<a href="/property-search/property-details/1021206?StrtNum=1507"><img alt="1507 BOSTWICK LN" src="/res/slir/w75-h57-c4:3/propertyimages/20120904/BB/DSCN0738.JPG"/></a>
然而,我真正想要的是“1507 BOSTWICK LN”内的<img alt=
我已经尝试过.get_text
返回空白,我尝试过lista = soup.findAll('td',{'class':'thumb'},{'alt':'img'})
,以及其他几种无法让我得到文本的变体。
我想让 BeautifulSoup 返回文本,或者正则表达式可以工作吗?我对 RE 的了解为零,任何意见将不胜感激!
尝试这个:
listm = soup.findAll('td',{'class':'thumb'})
for elem in listm:
print elem('img')[0]['alt']
这应该找到img
每个内的标签td
并打印的值alt
属性。
EDIT:
你不应该假设存在img
标签。改为这样做:
listm = soup.findAll('td',{'class':'thumb'})
for elem in listm:
imgs = elem('img')
if imgs:
print imgs['alt']
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)