正如标题所说,我有一些 DOM 操作任务。例如,我想:
- 找到所有具有蓝色的 H1 元素。
- 查找所有大小为 12px 的文本。
- ETC..
我怎样才能用 Rails 做到这一点?
谢谢.. :)
Update
我一直在根据这篇论文做一些关于提取网页内容的研究->http://www.springerlink.com/index/A65708XMUR9KN9EA.pdf http://www.springerlink.com/index/A65708XMUR9KN9EA.pdf
该步骤的总结是:
- 获取我想要提取的网址(单个网页)
- 根据一些视觉规则从网页中抓取一些元素(例如:抓取所有元素)H1 为蓝色)
- 用我的算法处理元素
- 将结果保存到我的数据库中。
-对不起,我的英语不好-
如果你想要做的是在 Rails 应用程序中操作 HTML 文档,你应该看看Nokogiri https://github.com/sparklemotion/nokogiri.
它使用 XPath 来搜索文档。通过以下内容,您将在文档中找到任何带有“blue”css 类的 h1。
require 'nokogiri'
require 'open-uri'
doc = Nokogiri::HTML(open('http://www.stackoverflow.com'))
doc.xpath('//h1/a[@class="blue"]').each do |link|
puts link.content
end
之后,如果您想要做的确实是解析当前页面 dom,那么您应该看看 JavaScript 和 JQuery。 Rails 做不到这一点。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)