我正在用 Python 构建一个简单的基于 Web 的 RSS 阅读器,但在解析 XML 时遇到问题。我首先在 Python 命令行中尝试了一些东西。
>>> from xml.dom import minidom
>>> import urllib2
>>> url ='http://www.digg.com/rss/index.xml'
>>> xmldoc = minidom.parse(urllib2.urlopen(url))
>>> channelnode = xmldoc.getElementsByTagName("channel")
>>> channelnode = xmldoc.getElementsByTagName("channel")
>>> titlenode = channelnode[0].getElementsByTagName("title")
>>> print titlenode[0]
<DOM Element: title at 0xb37440>
>>> print titlenode[0].nodeValue
None
我玩了一会儿这个,但是nodeValue
一切似乎都是None
。然而,如果您查看 XML,就会发现其中肯定存在值。我究竟做错了什么?
对于 RSS 源,您应该尝试通用提要解析器 http://code.google.com/p/feedparser/图书馆。它极大地简化了 RSS 提要的处理。
import feedparser
d = feedparser.parse('http://www.digg.com/rss/index.xml')
title = d.channel.title
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)