我正在寻找一个好的 python 库来帮助我解析 RSS 提要。有人用过 feedparser 吗?任何反馈?
Using feed解析器 https://pypi.org/project/feedparser/比用 minidom 或 BeautifulSoup 自己实现更好的选择。
- 它规范了所有版本的 RSS 和 Atom 之间的差异,因此您不必为每种类型使用不同的代码。
- 它对于检测提要中的不同日期格式和其他变化很有用。
- 它自动遵循 HTTP 重定向。
- 它清理 HTML 内容。
- 它支持 ETag 和 Last-Modified 标头,因此您只需下载 HTTP 标头而不是整个提要即可查看提要是否已更改。
- 它支持经过身份验证的提要。
- 它支持 HTTP 代理。
就像其他人提到的那样,只要尝试一下即可。这就像解析 feed 的 2 行代码。我唯一的抱怨是它只使用字典作为其数据模型,如果某些属性不在提要中,则字典中可能会丢失这些属性,因此您必须在代码中检查这些属性。但文档非常清楚哪些属性将始终存在于字典中以及哪些属性可能会丢失。
最后,我可以保证它,因为我已经编写了一个使用它的应用程序。看这里:http://www.feednotifier.com/ http://www.feednotifier.com/
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)