BeautifulSoup:获取特定表的内容

2023-12-23

我当地的机场 http://www.iaa.gov.il/Rashat/he-IL/Airports/BenGurion/informationForTravelers/OnlineFlights.aspx?flightsType=arr可耻地阻止没有 IE 的用户,而且看起来很糟糕。我想编写一个 Python 脚本,每隔几分钟获取一次到达和出发页面的内容,并以更易读的方式显示它们。

我选择的工具是机械化 http://wwwsearch.sourceforge.net/mechanize/欺骗该网站相信我使用 IE,并且美丽汤 http://www.crummy.com/software/BeautifulSoup/用于解析页面以获取航班数据表。

老实说,我迷失在 BeautifulSoup 文档中,无法理解如何从整个文档中获取表(我知道其标题),以及如何从该表中获取行列表。

有任何想法吗?


这不是您需要的具体代码,只是如何使用 BeautifulSoup 的演示。它找到 id 为“Table1”的表并获取其所有 tr 元素。

html = urllib2.urlopen(url).read()
bs = BeautifulSoup(html)
table = bs.find(lambda tag: tag.name=='table' and tag.has_attr('id') and tag['id']=="Table1") 
rows = table.findAll(lambda tag: tag.name=='tr')
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

BeautifulSoup:获取特定表的内容 的相关文章

随机推荐