我正在使用 Nokogiri,它非常适合小文档。但对于 180KB HTML 文件,我必须增加进程堆栈大小,通过ulimit -s
,并且解析和XPath查询需要很长时间。
是否有使用现有 Ruby 发行版的更快方法?
我正在习惯 XPath,但解决方案不一定需要支持 XPath。
标准是:
- 写得快。
- 快速执行。
- 强大的结果解析器。
查看牛宝石。它比 LibXML 和 Nokogiri 更快,并且支持内存解析以及 SAX 回调解析。完全公开,我写的。
在性能对比中http://www.ohler.com/software/thoughts/Blog/Entries/2011/9/21_XML_with_Ruby.html比较 DOM(内存中)和 SAX(回调)解析器。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)