如何用绝对路径 URL 替换相对路径 URL

2024-04-02

我将 HTML 内容存储在数据库中，并且希望将所有相对资源引用转换为使用绝对路径。例如，我的所有图像标签看起来都是这样的：

<img src=\"/system/images/146/original/03.png?1362691463\">

我正在尝试前置"http://example.com" to the "/system/images/"小路。我有以下代码，我希望能够处理这个问题，但遗憾的是它似乎没有导致任何更改：

text = "<img src=\"/system/images/146/original/03.png?1362691463\">"
text.gsub(%r{<img src=\\('|")\/system\/images\/}, "<img src=\"http://virtualrobotgames.com/system/images/")

不要使用普通的字符串操作来操作 URL 字符串，而是使用专门为该工作制作的工具。红宝石包括URI http://www.ruby-doc.org/stdlib-1.9.3/libdoc/uri/rdoc/URI.html类，还有更彻底的可寻址 https://github.com/sporkmonger/addressable gem.

如果我有一些带有我想要重写的链接的 HTML，我会这样做：

首先，解析文档：

require 'nokogiri'
require 'uri'

SOURCE_SITE = URI.parse("http://virtualrobotgames.com")

html = '
<html>
<head></head>
<body>
  <img src="/system/images/146/original/03.png?1362691463">
  <script src="/scripts/foo.js"></script>
  <a href="/foo/bar.html">foo</a>
</body>
</html>
'
doc = Nokogiri::HTML(html)

然后您就可以浏览文档并修改标签，例如<a>, <img>, <script>以及您想要的任何其他内容：

# find things using 'src' and 'href' parameters
tags = {
  'img'    => 'src',
  'script' => 'src',
  'a'      => 'href'
}
doc.search(tags.keys.join(',')).each do |node|

  url_param = tags[node.name]

  src = node[url_param]
  unless (src.empty?)
    uri = URI.parse(src)
    unless uri.host
      uri.scheme = SOURCE_SITE.scheme
      uri.host = SOURCE_SITE.host
      node[url_param] = uri.to_s
    end
  end
end

puts doc.to_html

运行后输出：

# >> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
# >> <html>
# >> <head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"></head>
# >> <body>
# >>   <img src="http://virtualrobotgames.com/system/images/146/original/03.png?1362691463">
# >>   <script src="http://virtualrobotgames.com/scripts/foo.js"></script>
# >>   <a href="http://virtualrobotgames.com/foo/bar.html">foo</a>
# >> </body>
# >> </html>

这并不是一个完整的、完全有效的示例。这适用于绝对链接，但您必须处理相对链接、具有同级/对等主机名的链接、缺少参数。

您还需要检查errors解析后的“doc”方法，以确保它是有效的 HTML。解析器可以重写/修剪无效 HTML 中的节点，试图理解它。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

rubyonrails

ruby

如何用绝对路径 URL 替换相对路径 URL 的相关文章

Heroku 上的“PG::错误 - 数字字段溢出”

我构建了一个应用程序来查询 Google Analytics 的过去 7 天的数据一切都在本地进行在 Heroku 上该过程运行顺利直到它尝试获取今天日期的数据然后我收到以下错误 2012 10 29T02 32 02 00 00
使用 Active Record 信誉系统 gem，当我按投票排序时不会发生排序

遵循 RailsCast 的信誉系统 gem 我将以下代码添加到我的 microposts controller 中 def index microposts Micropost paginate page params page find
ActiveSupport::JSON 解码哈希丢失符号

我正在尝试序列化和反序列化哈希当散列被解除序列化时密钥被解除符号化例如不是更多一而是一从 Rails 控制台 gt gt h one gt 1 two gt two one gt 1 two gt two gt gt j Ac
在 Ruby 文档中哪里可以找到字符串转义序列？

我可以在中找到有关 Ruby 转义序列的详细信息红宝石弦 http www tutorialspoint com ruby ruby strings htm and 转义序列 http en wikibooks org wiki Rub
在 ruby 中卸载动态声明的类

我有一个使用 theClass class eval 和 Object const set className theClass 定义的类有什么办法可以删除这个类的定义吗在测试过程中我需要加载同一类的不同版本 Object send
Rails 中的命名空间模型生成 NameError：未初始化的常量

我有一个这样的文件夹结构 app models bar foo rb connection rb foo rb connection rb是一个用于连接到另一个数据库的抽象类所以 class Bar Connection lt Acti
活动管理：同一列中的多个操作，类似于查看、编辑、删除

我正在使用 active admin gem 为我的 ruby on Rails 应用程序提供一个管理控制台我遇到一个问题我想对索引页面上的每个项目进行多个自定义操作就像查看编辑删除一样但是当添加自定义操作时仅显示最后一个而
Ruby 字符串上的扫描和匹配有什么区别

我是 Ruby 新手并且一直使用String scan搜索某个数字第一次出现的位置返回值在嵌套数组中有点奇怪但我只是去了 0 0 为了我想要的价值观我确信它有它的用途只是我还没有使用它我刚刚发现有一个String match方法
Bootstrap Typeahead 仅显示第一个字母

我很难让 Twitter Bootstrap 的 Typeahead 正常工作 Typeahead 仅匹配输入的第一个字母我在预输入框中的结果看起来像 n n n N N n 我的代码是有人可以帮忙吗检查 html 中输出的数据源属性
在 rspec 中打印响应

我有一个测试无法开始工作所以我想通过打印响应来调试我的规范我尝试过使用print response body在我的规范中但 test log 或控制台中都没有输出我可能错过了一些东西我应该尝试什么 Thanks 您可以使用以下方式
RSpec 与 Shoulda？

我是单元测试场景的新手我现在只使用单元测试大约两个月了当我在 Ruby 中进行单元测试时我目前遵循 TDD 风格并使用 Test Unit TestCase 我还阅读了 RSpec 以及它如何遵循 BDD 方法我还读过关于 Shou
如何在 test/fixtures/user.yml 中创建可用于 Devise 4 中集成测试的测试用户？

从下面的代码中可以看到我已经创建了一个用户users yml 包括设备的集成测试助手test helper rb 这就是为什么我能够使用sign in方法基于设计的自述文件 https github com plataformatec
用于输入地址的自动完成文本框是个好主意吗？

通过传统形式输入我的地址让我发疯为什么我必须输入我的城市州 and邮政编码何时可以从我的邮政编码推断出我的城市和州从下拉列表中选择您的状态是一件很痛苦的事情通常您无法使用 Tab 键进入它您必须使用鼠标等替代文本 http im
YAML 每个缩进有多少个空格？

如果我在每个缩进级别使用一个空格两个或四个空格有什么区别吗 YAML 每个结构类型的空间数量有什么具体规则吗例如4嵌套空间maps 1每空间项目清单 etc 我正在为 elastic beanstalk ebextensions 编写
Ruby on Rails：如何使用 JSONPath 访问（并保存到数据库）JSON 数组中的嵌套对象/属性？

我正在尝试将 JSON 对象数组中的数据播种到我的数据库中我有两个单独的数据库表属性和单位一个属性有许多单位我已经能够通过 API 请求 JSON 数据然后将其播种到数据库成功地对属性信息属性模型执行此操作但是 Valua
Rails、Facebook API、Koala gem — 获取“喜欢”某个页面的用户的所有个人资料

使用 Rails3 和 koala gem 如何检索喜欢 FB 页面的用户的所有个人资料例如 http facebook com DAKINE 有可能吗作为最终结果我需要获取一堆存储在数据库中的用户配置文件 Thanks 在 Fac
如何停止 Heroku 服务器？

我有一个托管在 heroku 上的临时服务器我只想将其关闭但不想破坏该应用程序我该怎么做我是否有类似 heroku stop 之类的命令例如 heroku restart 来重新启动 OR 有没有办法让服务器在超过 750 小时免
Thor 可执行文件 - 忽略任务名称

雷神维基页面制作可执行文件 https github com wycats thor wiki Making An Executable 向您展示如何创建由 thor 支持的 CLI 命令如下所示 bash mythorcommand
未定义符号：尝试运行瘦网络服务器时的 SSLv2_method

我已经用 rvm 安装了 OpenSSL rvm pkg install openssl 然后做了rvm reinstall 1 9 3 with openssl dir rvm path usr 当我尝试运行瘦网络服务器时出现以下错误
RVM 无法通过 SSH 工作（作为一项功能）

我刚刚在 Debian 6 服务器上安装了 RVM 一开始没有任何问题但是在一切设置完成后我无法在终端中运行 RVM 我打字时收到的消息rvm use is RVM is not a function selecting rubies

随机推荐

Apache 的 Velocity — getTemplate() 。如何传递字符串/对象而不是 .VM 文件

Apache 的 Velocity getTemplate 实际上它允许传递 vm 文件名我可以在这里传递字符串对象吗有什么方法可以传递字符串对象吗这是一个对我有用的示例代码速度版本 1 7我使用 log4j 作为记录器 imp
当我尝试使用 Facebook 或 Google 登录时，GetExternalLoginInfoAsync 始终返回 null

我有一个问题OWIN验证我总是收到空值GetExternalLoginInfoAsync 当我尝试使用 Facebook 或 Google 登录时但是有一些神秘的情况当我打开 Fiddler 时我使用这种方法得到了正确的数据我不明
在代码中设置静态资源

我的作品里有几种风格App xaml file
如何对 pandas 数据框中的一组行执行函数？

我正在尝试实施一个算法 https github com sebleier RDP 假设该算法作为函数 xyz 执行该函数专门设计用于对轨迹数据即 x y 坐标进行操作该函数有两个参数第一个参数是list of tuples x
Bootstrap 3.0 少于 12 列的网格

我正在尝试使用只有 7 列的网格创建一个日历我想让这 7 列均匀分布并适合整行目前 7 列加起来不等于 12 我得到 12 列其中 5 列为空 Bootstrap 3 有没有办法让所有 7 分布在一行中您最好的选择可能是创建您自己的
为什么基于 Glass/GDK 的 VoiceListener 在 XE16 中只能捕获一次 VoiceCommand？

在寻找一种使用 Google GDK 实现上下文语音命令的方法时我遇到了这个post https stackoverflow com questions 21168267 然而示例代码似乎仅适用于 XE12 不适用于 XE16 我最近测
使用一对多关系在 Django 中创建 2 种不同的用户类型

我正在创建一个篮球统计应用程序我希望有两种不同的用户类型教练和球员我希望教练能够登录并仅查看他的球员的统计数据因此一名教练将拥有多名球员我希望能够为每个教练创建用户个人资料并仅显示他们的球员而不是数据库中的所有球员到目前为
谷歌地图数据层，点击多边形并更改不透明度（Chrome Bug）

我有一个谷歌地图我使用 addGeoJson 将几何数据加载到数据层一切正常直到我尝试在多边形上绑定事件以更改 opactiy 设置我从OSM检索城市边界来绘制多边形我认为我的json对象格式很好我以Google作为参考 ht
TypeScript 编译中缺少 in-memory-data.service.ts

浏览 Angular 教程了解如何在中使用 http 请求https angular io tutorial toh pt6 https angular io tutorial toh pt6 我到了这一点使用以下命令生成类 src a
Sublime Doctype HTML 片段

有没有办法可以将下面的作为片段插入我尝试使用首选项 gt 键绑定用户但引号确实很重要您可以通过创建一个新的代码片段Tools gt New Snippet
onSharedPreferenceChanged 不会一直触发

我对这个方法有一个奇怪的问题当我编辑 EditTextPreference 时仅当我更改值时才调用它而在 MultiSelectListPreference 上仅当我第一次更改时才调用它这是我的片段代码 public class
Excel 解算器具有非相邻单元格约束？

我是 Excel 求解器的新手只是在拿起一本数据科学书籍后才了解它我想更熟悉这个工具所以我一直在尝试解决不同的问题但我被困在一个问题上我什至不确定是否可以使用求解器基本上我需要检查的约束是两个单元格是否相邻我的问题我有一堆
在 Excel 中计算唯一值

我需要在 Excel 中计算范围 C2 C2080 中的唯一值谷歌搜索公式 SUM IF FREQUENCY MATCH C2 C2080 C2 C2080 0 MATCH C2 C280 C2 C2080 0 gt 0 1 返回不正确的
使用多层 - KineticJS

我正在使用 KineticJS 4 0 5 目前正在尝试绘制几个图层的内容但只绘制了添加到舞台的最后一个图层如果我正确理解了文档这应该是可能的否则我们为什么需要一层我有三个不同的层仅包含 Kinetic Rect 对象的背景层
MPANDROIDCHART：如何使用 .setViewPortOffsets(0,0,0,0) 绘制 X 标签

当我的图表已将 setViewPortOffsets 设置为 0 0 0 0 时我在绘制 X 标签时遇到问题我知道 setViewPortOffsets 的作用但我不知道如何设置它以仅使左右边距消失边有人能帮助我吗 PS 抱歉我的英
逐行修改csv文件

我有一个大文件我想修改其中的每一行我想使用 PHP 快速完成我的文件是 CSV 文件 20010103 02 00 00 0 9496 20010103 03 00 00 0 9504 20010103 04 00 00 0 9499
有没有办法观察 UIViewPropertyAnimator 中fractionComplete的变化

我一直在看非常酷的新作品UIViewPropertyAnimatoriOS 10 中的类它可以让你easily执行诸如暂停恢复和反转飞行中 UIView 动画之类的操作过去您必须操作系统创建的底层 CAAnimations 才能对
Android BroadcastReceiver还是简单的回调方法？

在我的项目中我正在使用BroadcastReceiver作为来自长时间运行的线程的回调例如通知活动下载已完成并从 Worker 发送一些响应数据Thread以便活动可以向用户显示适当的消息使用BroadcastReceiver每次使用
:: C++ 中模板函数调用前面的范围解析运算符

我被模板和范围解析运算符困住了我在文件中找到了这些行我无法弄清楚为什么我们在模板函数调用前面使用据我所知当引用全局变量时我们只能在变量前面使用任何想法都会有帮助 define CREATE AND DECODE TYPE Typ
如何用绝对路径 URL 替换相对路径 URL

我将 HTML 内容存储在数据库中并且希望将所有相对资源引用转换为使用绝对路径例如我的所有图像标签看起来都是这样的 img src 我正在尝试前置 http example com to the system images 小路我有

如何用绝对路径 URL 替换相对路径 URL

如何用绝对路径 URL 替换相对路径 URL 的相关文章

随机推荐

热门标签