PHP:从字符串中获取 URL 的正则表达式[重复]

2024-03-23

可能的重复:
识别字符串中是否存在 URL https://stackoverflow.com/questions/951198/identifying-if-a-url-is-present-in-a-string
Php 解析链接/电子邮件 https://stackoverflow.com/questions/1038284/php-parse-links-emails

我正在编写一些 PHP 代码,它从各种来源获取输入,并需要找到 URL 并将它们保存在某个地方。需要处理的输入类型如下:

http://www.youtube.com/watch?v=IY2j_GPIqRA
Try google: http://google.com! (note exclamation mark is not part of the URL)
Is http://somesite.com/ down for anyone else?

Output:

http://www.youtube.com/watch?v=IY2j_GPIqRA
http://google.com
http://somesite.com/

我已经从互联网上借用了一种有效的正则表达式,但不幸的是擦除了查询字符串 - 不好!

任何帮助组合正则表达式的帮助,或者可能是此问题的其他解决方案,将不胜感激。


Jan Goyvaerts,正则表达式大师,在他的博客中解决了这个问题 http://www.regexguru.com/2008/11/detecting-urls-in-a-block-of-text/。有很多注意事项,例如正确提取括号内的 URL。您需要什么完全取决于输入数据的“质量”。

对于您提供的示例,\b(?:(?:https?|ftp|file)://|www\.|ftp\.)[-A-Z0-9+&@#/%=~_|$?!:,.]*[A-Z0-9+&@#/%=~_|$]在不区分大小写模式下使用时有效。

因此,要查找多行字符串中的所有匹配项,请使用

preg_match_all('/\b(?:(?:https?|ftp|file):\/\/|www\.|ftp\.)[-A-Z0-9+&@#\/%=~_|$?!:,.]*[A-Z0-9+&@#\/%=~_|$]/i', $subject, $result, PREG_PATTERN_ORDER);
$result = $result[0];
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

PHP:从字符串中获取 URL 的正则表达式[重复] 的相关文章

  • PHP:会话 |无法解码会话对象

    我尝试将电子商务功能添加到遗留项目中 因此我仍然需要旧的会话处理程序 我使用 PHP v7 1 14 和 Session2DB https github com voku session2db tree 4 0 0 https github
  • PHP和.htaccess认证解决方案

    这是布局 web root admin dir index php js img other files dirs dir files 到目前为止 我使用 htaccess passwd 保护管理目录 因为我希望对该目录中的所有文件 包括
  • PHP MS Word 文件页数

    实际上我正在尝试计算 ms word 文件的页数 我正在使用这个 php 脚本 但是 没有向我显示确切的结果 并且脚本不是那么快 谁能帮助我获得更好的脚本 word new COM word application if word echo
  • 用掩码替换字符串模式的最快方法

    我有类似的字符串 string string key foo bar 和参数数组 params array foo gt 1 bar gt 2 如何以 string 模式替换此参数 预期结果是 string key 1 2 首先 您需要重写
  • mPDF 临时文件不可使用 Yii 写入

    我尝试打印 PDF 格式的证书 但是当我将代码推送到暂存阶段时 它说 Temporary files directory var www protected vendor mpdf mpdf src Config tmp is not wr
  • 创建正则表达式来检查强密码

    假设我有一个检查字母数字的正则表达式 我现在想创建另一个正则表达式来检查密码中至少有 1 个数字 我想检查它是否至少有 1 个非字母数字字符 字母或数字以外的字符 我应该单独调用每个函数 如果一个函数失败返回 false 还是有办法将它们合
  • 正则表达式贪婪匹配未按预期工作

    我有一个非常基本的正则表达式 我只是不明白为什么它不起作用 所以问题分为两部分 为什么我当前的版本不起作用以及正确的表达方式是什么 规则非常简单 必须至少包含 3 个字符 如果 字符是第一个字符 则必须至少包含 4 个字符 因此 以下情况应
  • 如果列表中的某个字符位于该字符之前,请选择该字符

    我有这个正则表达式 a z s gmi 该正则表达式选择 从我的文字中 sme a eliezovce 2015 Spolo ne pre Eur pu Osl vili aj 940 但我只想选择 没有 如果列表中的某些字符 a z 之前
  • 匹配 JavaScript RegEx 中的不可见字符

    我有一些包含不可见字符的字符串 但它们位于可预测的位置 通常 围绕我想要提取的文本片段 然后在第二次出现之后我想保留文本的其余部分 我似乎不知道如何关闭隐形字符 and将它们从我的结果中排除 为了匹配隐形 我一直在使用这个正则表达式 xA0
  • laravel 5:找不到类“输入”

    In my routes php我有的文件 Route get function return view login Route get index function return view index Route get register
  • 捕获动态表中 HTML 元素的值

    我有从数据库生成的以下动态表
  • 如何在正则表达式中区分数字和ip地址?

    例如 如果我们查看 5 56 和 183 55 0 144 基本上 当你做这样的事情时 d d 它匹配 5 56 189 55 和 0 144 有没有办法通过正则表达式仅匹配数字而不匹配 ip 地址的部分 我尝试使用前瞻 但我不知道它应该是
  • php循环中的ajax在按钮单击时执行操作

    所以我有一个 php 循环 我使用 jquery 滑动切换来隐藏 显示带有 sql 结果的表 目前该表仅使用 php 加载 但由于发生了很多事情 导致了一些加载问题 我需要使用滑动切换 btn 来触发 ajax 因此它仅在按下按钮时请求当前
  • PHP:从 POP3 或 IMAP 下载传入电子邮件,解析它,并将其标记为服务器上的已读/删除

    我正在尝试将传入电子邮件添加到我的网络应用程序中 它是基于 CodeIgniter 和 PHP 构建的 据我所知 我还没有找到任何 CI 库来执行此操作 我想要做的是有一个控制器通过 POP3 或 IMAP 连接到我的邮箱 并检索消息 解析
  • 字边界正则表达式问题

    我在使用单词边界时遇到问题 b在我的正则表达式中 我正在使用 R 但当我尝试时问题也存在http regexr com http regexr com 我使用的模式是 bs l b 虽然我预计下面的第 1 行和第 3 行能够匹配此模式 但只
  • BigQuery REGEXP_MATCH 和重音:边界通配符失败?

    在 GAS 中 我可以正确地将重音符号与具有边界字符的正则表达式相匹配 例如 b b 仅当字符 是单独的单词时才匹配 这在 GAS 中有效 function test regExp var str la s ance est Paris v
  • PHP 中的数据清理[关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • ZF2 - 从路线生成 URL

    我无法弄清楚在 zend 2 中从我想要的任何地方生成 Url 我得到了动作和控制器 所以我尝试这个 this gt url myControllerName array action gt myActionName 但这返回一个对象 我只
  • 升级到 5.4 但“php -v”仍然返回旧版本

    我使用的是 OSX Lion 10 7 5 正如建议的如何在 Mac OS X 中升级 PHP https stackoverflow com questions 2526085 how do i upgrade php in mac os
  • 我应该写什么来从 CI 中的控制器重定向页面?

    这是我的控制器

随机推荐

  • 使用 xlrd 时读取包含公式的单元格值会返回 0.0

    我尝试读取单元格值 例如 Excel 工作表中的 E5 和 E5 包含一个公式 A29 A2 我使用以下代码 它返回 0 00 而不是实际值1 440408 有办法解决这个问题吗 我想打印正确的值 请在这件事上给予我帮助 谢谢 book x
  • jQuery 在 Chrome 和 Mac OS 上停止运行

    看看这个小提琴 http jsfiddle net mattball nWWSa http jsfiddle net mattball nWWSa var lis ul innerfade gt li function fadeThemOu
  • 适用于商品 Linux 存储场的最佳分布式文件系统 [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 我有很多闲置的英特尔 Linux 服务器 数百台 并且希望将它们用于 Web 托管和文件共享环境中的分布式文件系统 这不适用于 HPC 应用程序
  • 如何按顺序获取int中的每个数字?

    我有一个整数 int iNums 12476 我想从中获取每个数字作为整数 就像是 foreach iNum in iNums printf i iNum 所以输出将是 1 2 4 7 6 但我需要每个数字作为int not as char
  • 在类中找不到 main(String[]) 方法

    我收到以下错误 在类中找不到 main String 方法 import java util class Coor int x y w Coor int x int y int w this x x this y y this w w cl
  • gtkmm 的 CMake 错误

    我正在使用 Debian 8 并安装了 libgtkmm 3 0 以及 dev 现在我有一个使用 gtkmm 的非常简单的程序 基本上是一个 Hello World 主要 cpp include include BrowserWindow
  • 如何用许多随机数填充 MySQL 表?

    我要问一个已经被问过的问题very https stackoverflow com questions 9505930 populate mysql table with random data in python抽象的terms http
  • 无法从“字符串”转换为“System.IFormatProvider”

    这段代码给了我这个错误 var n 9 7 2014 8 22 35 AM var m n ToString yyyy MM dd T HH mm ssZ 但这段代码可以正常工作 并以正确的格式返回日期 var n DateTime Now
  • 如何正确使用实时优先级

    我的问题可能并不是真正关于实时处理 但话又说回来 它可能是 我的应用程序有几个比 GUI 重要得多的线程 但是 我确实希望 GUI 至少可用 我不希望它始终锁定 并且我确实想根据我正在执行的处理结果更新屏幕 目前 我的所有必需项目都隔离在单
  • 随机森林回归中的样本大小

    如果理解正确 当计算随机森林估计量时 通常会应用引导法 这意味着仅使用来自样本 i 的数据构建树 i 并通过替换选择 我想知道sklearn的样本大小是多少随机森林回归器 http scikit learn org stable modul
  • R 错误:影子图形设备错误

    是的 我知道上述错误有很多线索 但 至少我 无法找到解决方案 因此 RStudio 在尝试绘制某些内容时出现以下错误 Error in RStudioGD Shadow graphics device error r error 4 R c
  • 加载生成的纹理数据在 Libgdx/Lwjgl 中是不确定的

    数据格式如下 final int width 256 final int height 256 final float data new float width height 4 FloatBuffer dataBuf int textur
  • Makefile 规则错误:*** 混合隐式规则和普通规则

    在内核Makefile中 Modules prepare scripts FORCE cmd crmodverdir Q MAKE KBUILD MODULES if CONFIG MODULES 1 build build dir ko
  • Laravel 5 - 重定向到 HTTPS

    正在处理我的第一个 Laravel 5 项目 但不确定在哪里或如何放置逻辑以在我的应用程序上强制使用 HTTPS 这里的关键是有许多域指向该应用程序 并且只有三分之二使用 SSL 第三个是后备域 说来话长 所以我想在我的应用程序逻辑而不是
  • 如何模式匹配 scala 列表的头和尾类型?

    我想pattern match在a的不同部分list in scala关于的类型head and tail class Solution07 extends FlatSpec with ShouldMatchers plain recurs
  • 在 VS2015 中构建后执行 Gulp.js 任务

    我有一个基本的 Asp Net 5 站点 它使用 Gulp JS 任务来清理 复制和缩小 CSS 和 JS 文件 在任务运行程序资源管理器中运行这些任务时 一切都很好 旧脚本被删除 新脚本被复制 文件被缩小 我希望在 VS2015 中自动执
  • 如何使用 genstrings 获取所有 NSLocalization,同时保留当前翻译

    假设我的 iOS 应用程序已经有日语翻译 localizatible strings 说 继续 続 但是 我已经在代码中添加了新的 NSLocalization 但我想使用 genstrings 来获取所有新的 NSLocalization
  • Django - 如何简单地获取域名? [复制]

    这个问题在这里已经有答案了 首先 我想说我是 Django 的初学者 我正在寻找一种简单的方法来检索我的 Django 网站的域名 我想在我的settings py 中执行此操作 我已经尝试过像这样的套接字 socket gethostna
  • 为什么 Ajax.ActionLink 更新整个页面而不是只更新 UpdateTarget

    这应该只替换 UpdateTarget 但事实并非如此 它替换了整个页面 我不明白为什么 返回正确的部分视图 但不是替换目标 id 而是替换整个页面 div p this is a test p Ajax ActionLink Edit G
  • PHP:从字符串中获取 URL 的正则表达式[重复]

    这个问题在这里已经有答案了 可能的重复 识别字符串中是否存在 URL https stackoverflow com questions 951198 identifying if a url is present in a string