所以我的问题是,在相同的内容中有 iframe、图像标签等。它们都有正则表达式匹配,可以将它们转换为正确的格式。
最后剩下的就是普通的 URL。我需要一个正则表达式,它将找到所有只是链接而不是在 iframe、img 或任何其他标签内的链接。本例中使用的标签是常规 HTML 标签,而不是 BB。
目前我得到了这个代码作为内容渲染的最后一遍。但它也会对上面完成的所有其他操作(iframe 和 img 渲染)做出反应。因此它也会交换 URL。
$output = preg_replace(array(
'%\b(([\w-]+://?|www[.])[^\s()<>]+(?:\([\w\d]+\)|([^[:punct:]\s]|/)))%s'
), array(
'test'
), $output);
我的内容看起来像这样:
# dont want these to be touched
<iframe width="640" height="360" src="http://somedomain.com/but-still-its-a-link-to-somewhere/" frameborder="0"></iframe>
<img src="http://someotherdomain.com/here-is-a-img-url.jpg" border="0" />
# and only these converted
http://google.com
http://www.google.com
https://www2.google.com<br />
www.google.com
正如您所看到的,链接末尾也可能有一些内容。经过一整天的尝试正则表达式的工作后,最后<br />
对我来说是一场噩梦。
描述
此解决方案将匹配不在标签属性值内的 url,并将它们替换为新的内容。
正则表达式匹配您跳过的内容和您替换的内容。然后 preg_match_callback 执行一个内部函数,该函数测试捕获组 1 是否已填充(这是所需的文本),如果填充则返回更改,否则仅返回不需要的文本。
我使用了您的 url 匹配正则表达式,并进行了一些小的修改,例如转换未使用的捕获组(
...)
到非捕获组(?:
...)
。这使得正则表达式引擎运行得更快并且更容易修改表达式。
原始表达式:<(?:[^'">=]*|='[^']*'|="[^"]*"|=[^'"][^\s>]*)*>|((?:[\w-]+:\/\/?|www[.])[^\s()<>]+(?:\([\w\d]+\)|(?:[^[:punct:]\s]|\/)))
Example
Code
<?php
$string = '# dont want these to be touched
<iframe width="640" height="360" src="http://somedomain.com/but-still-its-a-link-to-somewhere/" frameborder="0"></iframe>
<img src="http://someotherdomain.com/here-is-a-img-url.jpg" border="0" />
# and only these converted
http://google.com
http://www.google.com
https://www2.google.com<br />
www.google.com';
$regex = '/<(?:[^\'">=]*|=\'[^\']*\'|="[^"]*"|=[^\'"][^\s>]*)*>|((?:[\w-]+:\/\/?|www[.])[^\s()<>]+(?:\([\w\d]+\)|(?:[^[:punct:]\s]|\/)))/ims';
$output = preg_replace_callback(
$regex,
function ($matches) {
if (array_key_exists (1, $matches)) {
return '<a href="' . $matches[1] . '">' . $matches[1] . '<\/a>';
}
return $matches[0];
},
$string
);
echo $output;
Output
# dont want these to be touched
<iframe width="640" height="360" src="http://somedomain.com/but-still-its-a-link-to-somewhere/" frameborder="0"></iframe>
<img src="http://someotherdomain.com/here-is-a-img-url.jpg" border="0" />
# and only these converted
<a href="http://google.com">http://google.com<\/a>
<a href="http://www.google.com">http://www.google.com<\/a>
<a href="https://www2.google.com">https://www2.google.com<\/a><br />
<a href="www.google.com">www.google.com<\/a>
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)