如何从文本中提取 URL

2024-04-20

如何在 Ruby 中从纯文本文件中提取所有 URL?

我尝试了一些库,但在某些情况下它们会失败。最好的办法是什么?


如果您喜欢使用 Ruby 中已提供的功能:

require "uri"
URI.extract("text here http://foo.example.org/bla and here mailto:[email protected] /cdn-cgi/l/email-protection and here also.")
# => ["http://foo.example.org/bla", "mailto:[email protected] /cdn-cgi/l/email-protection"]

阅读更多:http://railsapi.com/doc/ruby-v1.8/classes/URI.html#M004495 http://railsapi.com/doc/ruby-v1.8/classes/URI.html#M004495

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何从文本中提取 URL 的相关文章

  • 将 Ruby 程序作为 Windows 服务运行?

    是否可以将 ruby 应用程序作为 Windows 服务运行 我看到有一个相关的问题讨论运行Java 应用程序作为 Windows 服务 https stackoverflow com questions 25530 best method
  • 未找到命令/使用自动测试通过“捆绑安装”安装缺少的 gem 二进制文件

    我对 RoR 完全陌生 我正在关注迈克尔 哈特尔的书 我无法运行自动测试 请提出问题所在以及解决方案 当我在 Rails 项目目录中的命令行运行 自动测试 时 我得到以下信息 bash autotest command not found
  • 在 Ruby 中获取 system() 调用的输出

    如果我使用调用命令内核 系统 http ruby doc org core 2 2 0 Kernel html method i system在 Ruby 中 如何获取其输出 system ls 我想扩展和澄清混沌的答案 https sta
  • 如何检查 lat long 是否在城市范围内

    如何检查我的纬度 经度是否在城市范围内 或者例如 大伦敦包含在 bbox 0 489 51 28 0 236 51 686 Source http wiki openstreetmap org wiki Bounding Box http
  • 拆分为不同的换行符

    现在我正在做一个split在字符串上并假设用户的换行符是 r n像这样 string split r n 我想做的事分为两部分 r n要不就 n 那么正则表达式将如何分割其中的任何一个呢 你试过了吗 r n The 使得 r选修的 用法示例
  • 我在“宝石列表”中看到宝石,但“没有要加载的文件”

    我是Ubuntu10 sudo apt get install ruby1 9 1 full 然后下载 ruby gem 1 3 7 的源并安装它 sudo ruby setup rb 然后 例如 安装 sinatra sudo gem i
  • 为什么到处都有冻结常数?

    我们可以很容易地从许多著名的存储库中找到这种样式 例如机架 导轨等 例如在机架中 https github com rack rack blob 28e77c710ac2ddb35c436d78d72e28f28f964446 lib ra
  • 需要“Ruby 编程语言”中的反射示例帮助

    在这个例子中来自Ruby 编程语言 第270页 我很困惑为什么instance eval示例代码最后一行的方法定义一个类方法 called String empty 你不使用class eval定义一个类方法并instance eval当你
  • Ruby 中类单例方法的方法查找

    我的印象是obj method导致 ruby 寻找method thusly Look in obj的单例类 查看包含的模块obj的单例类 Look in obj的班级 查看包含的模块obj s class 对类的超类重复步骤 3 和 4
  • 使用线程和 ruby​​ mechanize 安全吗?

    有没有人见过很多这样的错误 Exception Net HTTPBadResponse at usr lib ruby 1 8 net http rb 2022 wrong status line SOME HTML CODE HERE 何
  • irb 中的单词边界

    我在 Snow Leopard 上使用终端 在命令行中 如果我输入foo bar baz bang quuz quux 当我点击选项 B 时 它会将光标逐字向后移动 在每个句点处停止 因为它认为句点是单词边界 同样 选项 F 逐字向前移动
  • 如何从 ActionMailer 发送签名电子邮件?

    我使用 GMail 作为我的 SMTP 服务器 我的配置工作得很好 config initializers action mailer rb ActionMailer Base smtp settings tls gt true addre
  • 在 Ruby 中测试重叠数组

    假设我有一个 Ruby 数组数组 100 300 400 500 我正在通过添加连续的 CSV 数据行来构建它 添加新子数组时 测试子数组中两个数字覆盖的范围是否被任何先前的子数组覆盖的最佳方法是什么 换句话说 在上面的示例中 每个子阵列都
  • after_save 回调将 Updated_by 列设置为 current_user

    我想使用 after save 回调将 Updated by 列设置为 current user 但 current user 在模型中不可用 我该怎么做 您需要在控制器中处理它 首先对模型执行保存 如果成功则更新记录字段 Example
  • 在 rake 任务中运行 capybara

    如何在 Rake 任务中运行 Capybara 功能 例如 visit http google com 谢谢你 在任务中尝试这样的事情 require capybara require capybara dsl Capybara curre
  • Rails 是否支持侦听 UDP 套接字的简洁方式?

    在 Rails 中 集成更新模型某些元素的 UDP 侦听过程的最佳方式是什么 特别是向其中一个表添加行 简单的答案似乎是在同一进程中使用 UDP 套接字对象启动一个线程 但不清楚我应该在哪里执行适合 Rails 方式的操作 有没有一种巧妙的
  • ruby 1.9 如何将数组转换为不带括号的字符串

    我的问题是关于如何在 ruby 1 9 中将数组元素转换为字符串而不需要括号和引号 我有一个数组 数据库提取 我想用它来创建定期报告 myArray Apple Pear Banana 2 15 12 在 ruby 1 8 中我有以下行 r
  • 如何在 Ruby 数组的所有元素之间插入新元素?

    我有一个数组 想在所有元素之间插入一个新元素 就像join方法 例如 我有 1 333 我需要的是 1 333 请注意 在所有元素之间插入了一个新的空哈希 编辑 目前我所拥有的是 irb main 028 0 gt a 1 333 gt 1
  • 在 Ruby 中, put 方法应用到哪个对象?

    在 ruby 中 您使用点来调用方法 或者换句话说 将方法发送到所处理的对象 100 to i 我们正在向对象 100 发送消息 to i 当我们这样做时 puts hello put 方法应用于哪个对象 我是这样想的 self puts
  • 查找所有具有重复名称的用户

    我有具有名字和姓氏字段的用户 我需要做一个 ruby 查找根据名字和姓氏具有重复帐户的所有用户 例如 我想要一个查找功能 可以搜索所有其他用户 并查找是否有任何用户具有相同的姓名和电子邮件 我在想像这样的嵌套循环 User all each

随机推荐

  • .NET 中的 GAC 是什么?

    只是为外行寻找 GAC 的简短概述 而不是链接 是的 基本上这是一种保持 DLL 全局可访问而不用担心冲突的方法 不再有 DLL 地狱 每个架构和版本都有自己的生存空间 它也有自己的方式在资源管理器中浏览它 所以如果你去 C Windows
  • axios - 发送表单数据和非表单数据

    我正在使用 axios 将数据发送到我的 nodejs express 服务器 如果我想发送表单数据 我会执行以下操作 并且效果很好 const formData new FormData formData append nameOfFil
  • 将开放曲线转换为有序像素列表:使用 numpy 的 Python 测试代码

    我有一个 numpy 数组中的开放曲线的图像 我需要构建一个根据曲线上的位置排序的点坐标列表 我写了一个剧本草稿 http dip4fish blogspot com 2011 06 converting open curve to lis
  • Jetpack Navigation 在 onNewIntent 中手动处理深度链接

    我正在使用 Jetpack 导航 我需要手动处理深层链接 因为 1 隐式深层链接无法正常工作android launchMode singleTask 如果应用程序已打开 深层链接无法正确重定向 https stackoverflow co
  • Hibernate - 不使用 import.sql 的种子数据库

    我来自 php laravel 每当我想为数据库播种时 我只需要运行php artisan db seed 这将运行一些 php 脚本 将数据插入数据库 我想使用 spring hibernate 实现同样的功能 我知道我可以添加一个imp
  • 如何描述类型滚动事件?

    我在滚动上添加了侦听器 并尝试使用事件 我如何描述 type 而不是 any 反应16 8 6 脚本3 4 const Component FC
  • 将 nil 字符串指针设置为空字符串

    如何将类型中字符串指针的引用值设置为空字符串 考虑这个例子 package main import fmt type Test struct value string func main t Test nil if t value nil
  • php:通过 UTC 偏移量设置时区

    使用 javascript 我知道我的用户时区是 UTC 3 现在我想用这些知识创建 DateTime 对象 usersNow new DateTime now new DateTimeZone 3 我收到回复 Unknown or bad
  • 创建具有多个子上下文的 Spring Boot 应用程序

    我正在尝试使用 Spring Boot 和分层应用程序上下文创建一个应用程序 我当前的主要方法如下所示 public static void main String args new SpringApplicationBuilder Tes
  • “文本可视化工具”使用哪个类?

    当我使用DebuggerVisualizer属性如下 c assembly DebuggerVisualizer typeof DataSetVisualizer typeof DataSetVisualizerSource Target
  • 使用 XSL 进行转换而无需对最终输出进行 HTML 编码的属性方式是什么?

    所以 我正在使用 NET 我有一个 XSL 文件 C 中的 XslTransform 对象 它读取 XSL 文件并将一段 XML 数据 内部制造 转换为 HTML 我注意到我的最终输出是 lt and gt 自动编码成 lt and gt
  • 使用开关启用和禁用推送通知

    我正在使用 firebase 推送通知 FCM 并且我想使用切换按钮启用和禁用通知 为此 我共享了启用和禁用通知的首选项 但似乎我的逻辑根本不起作用 开关打开或关闭没有任何区别 我仍然收到通知 我需要帮助谢谢 活动 val sharedPr
  • LoadfromText 给出错误 2285(Microsoft Office Access 无法创建输出文件)

    当使用loadfromtext在access中导入表单时 我不断收到运行时错误2285 在互联网上搜索发现很多人都有同样的问题 但没有解决方案 有谁知道导致此错误的原因是什么 Edit 此外 在包含数据库的文件夹中还会创建一个名为 erro
  • 如何对服务的默认 WCF 端点进行硬编码?

    在自托管服务中 我想使用 App config 中指定的端点 如果存在 或者如果 App config 为空 则使用代码中指定的默认端点 我怎样才能做到这一点 Edit 澄清一下 这是在服务器 服务 端使用 ServiceHost 一种方法
  • jQuery 在所有浏览器中的 SlideUp() 上闪烁...附有示例页面

    我知道这个问题已经讨论过好几次了 但我有一个有点不同的问题 当调用 slideUp 并且浏览器风已经向下滚动以查看所有底部内容时 当 div 滑动关闭时它会闪烁多次 示例页面如下 只需单击它所说的位置 然后滑动到底部并关闭上面的 div 之
  • printf 内部如何工作? [复制]

    这个问题在这里已经有答案了 可能的重复 无需汇编的 C C 函数定义 https stackoverflow com questions 2442966 c c function definitions without assembly 你
  • 以下哪种脚本语言更适合笔测试? [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 首先 我想避免语言上的激烈争论 可供选择的语言有 Perl Python 和 Ruby 我想说的是 我对所有这些都感到满意 但问题是我不能只专注
  • 2次API调用响应后执行代码

    您好 我正在进行两个 API 调用来进行一些检查 我想在两个调用完成后执行代码 var firstCall request get first function error response body body JSON parse bod
  • C# 外壳扩展

    在 NET 中创建 shell 扩展还有比这更简单的方法吗 http www theserverside net tt articles showarticle tss id ShellExtensions http www theserv
  • 如何从文本中提取 URL

    如何在 Ruby 中从纯文本文件中提取所有 URL 我尝试了一些库 但在某些情况下它们会失败 最好的办法是什么 如果您喜欢使用 Ruby 中已提供的功能 require uri URI extract text here http foo