我正在寻找一些东西来帮助我解析类似网站的一般元标签我发现这个 github 项目用于开放图形数据 https://github.com/intridea/opengraph。这是一个demo app http://ogit.heroku.com/.
基本上,我希望能够让用户从新闻网站输入 URL,并从中检索标题、描述等,从而为用户留下尽可能少的工作。在我开始自己的项目之前,我想知道是否存在与上面的项目类似的当前项目/gem? (因为它仅适用于开放图而不适用于一般元标记)
我还注意到facebook 的 linter http://developers.facebook.com/tools/lint/即使没有开放图特定标签也能做到这一点。
我会推荐诺科切宝石 https://rubygems.org/gems/nokogiri。它是一个 HTML、XML 等解析器,因此您可以使用它自己解析页面。这种方法的好处是它为您的特定用例提供了最大的灵活性。您可以使用 gem 来解析任何元标记和标头标记,只要您可以使用 XPath 或 CSS3 选择器来表达它们即可。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)