我需要从 django 网站中的网站获取一些数据。
现在我很困惑是否应该使用 python 解析库或网络爬行库。搜索引擎库也属于同一类别吗
我想知道两者之间有多少区别,如果我想在我的网站中使用这些功能,我应该使用哪个
如果您可以摆脱后台网络爬行,请使用scrapy http://scrapy.org/。如果需要立即拿东西使用html5lib http://code.google.com/p/html5lib/(更稳健)或lxml http://lxml.de/(快点)。如果你打算稍后做,请使用 Awesomerequests http://docs.python-requests.org/en/latest/index.html图书馆。我会避免使用 BeautifulSoup、mechanize、urllib2、httplib。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)