我有这段代码,使用 BeautifulSoup 从页面中获取一些文本
soup= BeautifulSoup(html)
body = soup.find('div' , {'id':'body'})
print body
我想将其作为一个可重用的函数,它接受一些 htmltext 和与之匹配的标签,如下所示
def parse(html, atrs):
soup= BeautifulSoup(html)
body = soup.find(atrs)
return body
但如果我这样打电话
parse(htmlpage, ('div' , {'id':'body'}")) or like
parse(htmlpage, ['div' , {'id':'body'}"])
我只得到 div 元素,body 属性似乎被忽略。
有没有办法来解决这个问题?
def parse(html, *atrs):
soup= BeautifulSoup(html)
body = soup.find(*atrs)
return body
进而:
parse(htmlpage, 'div', {'id':'body'})
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)