我尝试了 soup.find('!--') 但它似乎不起作用。提前致谢。
编辑:感谢您提供有关如何查找所有评论的提示。我有一个后续问题。具体如何搜索评论?
例如,我有以下评论标签:
<!-- <span class="titlefont"> <i>Wednesday 110518</i>(05:00PM)<br /></span> -->
我真的只想要这个东西<i>Wednesday 110518</i>
。 “110518”是日期 YYMMDD,我倾向于将其用作搜索目标。但是,我不知道如何在特定评论标签中查找某些内容。
您可以通过以下方式找到文档中的所有评论findAll
方法。请参阅此示例,了解如何准确地完成您想要做的事情删除元素 http://www.crummy.com/software/BeautifulSoup/documentation.html#Removing%20elements:
简而言之,你想要这个:
comments = soup.findAll(text=lambda text:isinstance(text, Comment))
编辑:如果您尝试在列中搜索,您可以尝试:
import re
comments = soup.findAll(text=lambda text:isinstance(text, Comment))
for comment in comments:
e = re.match(r'<i>([^<]*)</i>', comment.string).group(1)
print e
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)