如何避免 DOM 解析添加 html doctype、和标签？ [复制]

2023-11-27

<?
    $string = '
    Some photos<br>
    <span class="naslov_slike">photo_by_ile_IMG_1676-01</span><br />
    <span class="naslov_slike">photo_by_ile_IMG_1699-01</span><br />
    <span class="naslov_slike">photo_by_ile_IMG_1697-01</span><br />
    <span class="naslov_slike">photo_by_ile_IMG_1695-01</span><br />    
    ';

    $dom = new DOMDocument();
    $dom->loadHTML($string);
    $dom->preserveWhiteSpace = false;
    $elements = $dom->getElementsByTagName('span');
    $spans = array();
    foreach($elements as $span) {
        $spans[] = $span;
    }
    foreach($spans as $span) {
        $span->parentNode->removeChild($span);
    }
    echo $dom->saveHTML();


?>

我正在使用这段代码来解析字符串。当该函数返回字符串时，它会添加一些标签：

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html><body><p>Some photos<br><br><br><br><br></p></body></html>

有什么方法可以避免这种情况并返回干净的字符串吗？该输入字符串只是举例，使用时可以是任意html字符串。

从 5.4 开始的 PHP 版本，当使用 Libxml 2.6.0 或更高版本编译时，可以使用options参数为DomDocument::loadHTML()。有了它你可以这样做：

$dom = new \DomDocument();
$dom->loadHTML($string, \LIBXML_HTML_NODEFDTD | \LIBXML_HTML_NOIMPLIED);
// do stuff
echo $dom->saveHTML();

我们通过两个libxml 常量: LIBXML_HTML_NODEFDTD表示不添加文档类型定义，并且LIBXML_HTML_NOIMPLIED说不要添加隐含元素，例如<html> and <body>.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

php

Parsing

DOM

如何避免 DOM 解析添加 html doctype、和标签？ [复制] 的相关文章

Laravel 5：在控制台内核的 Schedule() 函数中使用 Cache:: 或 DB::

我正在尝试以不同的用户配置的时间间隔在 Laravel 5 中运行 Artisan 控制台命令我已经构建了控制台命令并拥有一个包含运行频率配置值的数据库具有 Eloquent 模型内schedule 的函数App Console
我可以在 php 中的 SESSION 数组上使用 array_push 吗？

我有一个想要在多个页面上使用的数组因此我将其设为 SESSION 数组我想添加一系列名称然后在另一个页面上我希望能够使用 foreach 循环来回显该数组中的所有名称这是会议 SESSION names 我想使用 array pu
snappy wkhtmltopdf 包装器将生成的 html 文件发送到浏览器

我像鼹鼠一样用谷歌搜索但找不到正确的方法我正在使用 WKHTMLTOPDF Wrapper Snappy 创建 PDF 如何将使用generateFromHtml方法生成的pdf直接发送到浏览器这就是我想做的 header Conte
单击行内的按钮时防止触发表行 onclick 事件

我有一个带有 ONCLICK 事件的表行切换下面的附加数据在其中一个行单元格内有一个按钮单击时执行 AJAX 操作当我单击按钮时行的 onclick 事件也会触发并且会发生附加数据在 AJAX 调用完成之前出现这对我来说是一个
boost::spirit::qi::语法和可变参数模板

我在使用可变参数模板定义语法时面临一个问题我首先定义一些包含在某些结构中的简单语法例如纬度经度如下所示 include
通过字符串操作预防 PHP SQL 注入[重复]

这个问题在这里已经有答案了可能的重复 PHP 中防止 SQL 注入的最佳方法 https stackoverflow com questions 60174 best way to prevent sql injection in php
测试 CodeIgniter 会话变量的正确方法是什么？

获取以下代码片段测试确保会话变量不为空的最佳方法是什么如果稍后在我的脚本中我调用以下内容第一个打印正确但在第二个我收到消息未定义的变量已登录我尝试过使用 empty and isset 但两者均未成功我还尝试使用向后执行
如何处理PDO异常[重复]

这个问题在这里已经有答案了我正在尝试与PDOphp 上的类但我在找到处理错误的正确方法时遇到了一些麻烦我编写了以下代码
确定 PHP 到目前为止执行了多长时间

我需要确定 PHP 函数到目前为止已经运行了多长时间有哪些选项可以确定某些 PHP 代码的运行时间我正在使用 zend 框架 Call microtime true 函数以毫秒分辨率获取当前时间
为什么视频在插入 DOM 之前就播放了？

为什么执行类似下面的事情 var videoBg videoBg
统计数据库中的注册用户数

我想反映在我的网站上注册的人数只有我拥有的代码不起作用它让我知道它不可能转换为字符串另外当我将其设置为在 HTML 中调用的函数时我收到 connection 未定义的错误 require once connect php sq
WordPress 子主题 -functions.php 复制 - 无法“重新声明”

我正在使用带有儿童主题 starkers child 的 Starkers 我需要编辑functions php来声明一个菜单所以我复制了functions php JS文件夹和external文件夹它们都在functions文件中的某
如何从文件中获取整个函数

好的我现在正在逐行阅读一个文件我知道文件中的每个函数名称因为它是在 XML 文档中的其他位置定义的应该是这样的 function function name 其中 function name 是函数的名称我从 XML 文档中获取所
Php Curl HTTP POST REQUEST 使用嵌套键值对设置自定义标头

如何使用 Curl 在 php 中设置此标头 CustomInfo 元素是数组嵌套键值对 AuthenticationInfo 元素是数组嵌套键值对
如何通过开始索引和结束索引提取子字符串？

str HelloWorld sub substr str 3 5 echo sub prints loWor 我知道 substr 采用第一个参数第二个参数是开始索引而第三个参数是要提取的子字符串长度我需要的是通过提取子字符串起始索
PHP 使用主键和辅助键对多维数组进行排序[重复]

这个问题在这里已经有答案了如何按主键和辅助键对多维数组进行排序例如假设有以下数组 result array result 0 prio 1 result 0 date 2010 02 28 result 0 post February
使用多个 WHERE 子句更新 Codeigniter 中的批次

我查看了 CI 用户指南来了解如何处理update batch 并且它似乎只接受一个索引来匹配要更新的行但在我的例子中我需要指定两个索引例如lang and id page我一起用作索引这样的lang en id page 115是
如何使用 PHP 将字符串按大写字母分解？

我有一个字符串 CamelCaseString 我想对大写字母进行explode split 或一些更好的方法来将该字符串分解为单个单词最简单的方法是什么解决方案更新此链接指向一个略有不同的问题但我认为答案通常比本页当前问题的答案更
MySQL如何从多个表中获取数据

我正在寻找 php MySQL jquery 的帮助我有2张桌子 table1表 1 有 4 列 id 标题 desc thumb img tabel2表 2 有 3 列 id 表 id img 我只想将 2 个表与 get QS 的值进
无法将句子插入数据库

我有一些句子我必须选择由 6 个以上单词组成的句子然后它们将被插入到数据库中

随机推荐

从内容页设置母版页上的属性值

每次加载页面时我都需要将数据传递给母版页中的变量我在每个内容页面上设置了一个RequiredRoles 字符串定义了访问该页面所需的角色在我的母版页上我有一种方法可以获取该数组并检查当前用户是否属于这些角色中的一个或多个我将如
方法重载装饰器

我正在尝试编写一个为 python 提供方法重载功能的装饰器类似于中提到的PEP 3124 我编写的装饰器非常适合常规函数但我无法让它适用于类中的方法这是装饰器 class Overload object def init self
UI Router Extras 破坏了我的单元测试并出现意外结果错误？

问题安装 ui router extras 不是普通的 ui router 时为什么我的测试失败我该如何使用ui router extras我的测试仍然通过吗如果你想快速安装请使用 yeoman angular fullstack
如何向单个客户端而不是所有客户端发送命令？

我正在用 Indy 10 编写一个简单的客户端服务器聊天程序我的服务器 idtcpserver 向客户端发送一条命令客户端应答但是当连接多个客户端并且服务器发送命令时 all连接的客户端向服务器发送数据如何向指定客户端而非全部客户
限制 API 调用。仅允许我的移动应用程序

我想要我的网络服务器接受请求起源仅从我的移动应用由于移动应用程序是客户端应用程序这意味着用户可以拥有二进制文件并反编译它或者使用 Fiddler 等工具来解释 API 调用并重建它们例如在控制台应用程序中所以我想要的是一种方法生
有哪些好的方法可以防止 JavaScript 多人游戏作弊？

想象一个带有滚动关卡的太空射击游戏有哪些方法可以防止恶意玩家修改游戏以谋取私利他可以做的服务器端难以限制的事情是自动瞄准在可见区域外窥视加速黑客攻击和其他事情有哪些方法可以防止这种情况发生假设服务器是任何语言并且客户端通过 W
故障模块：kernelbase.dll。应用程序崩溃

I Have an application done in Net framework 3 5 C Net I installed the application in Windows 7 But while opening some fo
Enum.IsDefined 带有标记的枚举

我目前正在看书C 4 0 简而言之顺便说一句我认为这是一本很棒的书即使对于高级程序员来说也可以作为很好的参考我回顾了有关基础知识的章节发现了一个技巧可以在使用标记枚举时判断枚举中是否定义了某个值书中指出使用Enum IsDef
为什么大写字母不能用于定义值的模式匹配？

为什么我可以使用小写字母作为名称 val a bC 1 2 1 2 match case a bC gt 并且不能使用大写字母 compile errors not found value A BC val A BC 1 2 compile
Django + PostgreSQL：填充范围内缺失的日期

我有一张表其中一列为date 每个日期可以有多个条目 date 2015 07 20 2015 07 20 2015 07 23 2015 07 24 我想使用 Django ORM 和 PostgreSQL 作为数据库后端来获取以下形式
gcc 链接共享库与符号链接

我有两个库例如两个烤面包机库libtoaster a so and libtoaster b so以及所有相关的主要次要修订符号链接例如libtoaster a so 1 0 0等等这两个库都实现了相同的烤面包机接口但只是进行了
使用 R，循环数据帧，并为循环中创建的对象分配适当的名称

这是数据分析师一直在做的事情特别是在处理缺少响应的调查数据时通常首先对一组完整的数据矩阵进行乘法插补将模型拟合到每个矩阵然后组合结果目前我正在手工做事并寻找更优雅的解决方案想象一下有 5 个 csv工作目录中的文件名为dat1
如何运行 Github 存储库？

我是一个编码新手所以这可能是一个愚蠢的问题我正在做一个 SQL 项目来学习该语言我想知道是否有办法下载并执行 Github 存储库我以前没有使用过 Github 谢谢如果你是新手我认为你应该学习如何使用git 您可以参考以下链接
詹金斯没有声纳运行选项？

我正在寻找在我们的詹金斯服务器上安装 sonarQube 我能找到的文档告诉我在中配置声纳运行器 Jenkins gt manage Jenkins gt Configure system 但是那里没有声纳跑步者选项有一个声纳选项
从AWS lambda@edge访问原始URL

我正在尝试使用 AWS Cloudfront 上的 lambda edge 实现多个网站的代理我的设置大致是 DNS domain com gt some uuid cloudfront net Cloudfront 分发 Cloudf
VIM 折叠头中的语法高亮显示

有没有办法让 VIM 继续对用作折叠标题的行应用格式例如我有以下代码 int foo int a int b int c 折叠后我看到 4 lines int foo int a int b 但是根据 Folded 类整行都会突出
MySQL - 我们可以按列位置而不是名称排序吗？

我在谷歌上查看过但找不到它我们可以在 MySQL 中使用字段的位置进行排序吗假设我有字段ID FirstName LastName Age但我想按字段 4 排序我可以这样做吗ORDER BY FieldPos4按年龄订购我还没有找到
在 C# 字符串/字符编码中，GetBytes()、GetString() 和 Convert() 之间有什么区别？

我们在将 Unicode 字符串转换为 UTF 8 字符串以通过网络发送时遇到问题 Start with our unicode string string unicode Convert u10A0 Get an array of byt
DataGridView 滚动事件（和 ScrollEventType.EndScroll）

交接时DataGridView Scroll事件您可以检查是否是滚动结束当用鼠标拖动滚动条时这大概是在释放鼠标按钮时问题是这似乎永远不会发生 e Type从来没有ScrollEventType EndScroll 这有什么问题吗如
如何避免 DOM 解析添加 html doctype、和标签？ [复制]

这个问题在这里已经有答案了

如何避免 DOM 解析添加 html doctype、 和 标签？ [复制]

如何避免 DOM 解析添加 html doctype、 和 标签？ [复制] 的相关文章

随机推荐

热门标签

如何避免 DOM 解析添加 html doctype、和标签？ [复制]

如何避免 DOM 解析添加 html doctype、和标签？ [复制] 的相关文章