用于查找 标记之间的所有内容的正则表达式

2024-05-03

我正在尝试找到一种方法来列出之间的所有内容<a> and </a>标签。所以我有一个链接列表,我想获取链接的名称(不是链接的位置,而是它们在页面上的名称)。对我来说真的很有帮助。

目前我有这个:

$lines = preg_split("/\r?\n|\r/", $content);  // content is the given page
foreach ($lines as $val) {
  if (preg_match("/(<A(.*)>)(<\/A>)/", $val, $alink)) {     
    $newurl = $alink[1];

    // put in array of found links
    $links[$index] = $newurl;
    $index++;
    $is_href = true;
  }
}

标准免责声明适用:使用正则表达式解析 HTML 并不理想。成功取决于逐个字符级别输入的格式良好。如果您不能保证这一点,则正则表达式将在某些时候无法执行正确的操作。

话说回来:

<a\b[^>]*>(.*?)</a>   // match group one will contain the link text
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

用于查找 标记之间的所有内容的正则表达式 的相关文章

随机推荐