如何防止 DOMDocument 转换为 unicode

2024-01-07

我正在尝试获取 a 的内部 HTMLDOMElement在 PHP 中。标记示例：

<div>...</div>
<div id="target"><p>Here's some &nbsp; <em>funny</em> &nbsp; text</p></div>
<div>...</div>
<div>...</div>

将上面的字符串输入到变量中$html，我在做：

$doc = new DOMDocument();
@$doc->loadHTML("<html><body>$html</body></html>");
$node = $doc->getElementById('target')
$markup = '';
foreach ($node->childNodes as $child) {
  $markup .= $child->ownerDocument->saveXML($child);
}

所结果的$markup字符串看起来像这样（转换为 JSON 以显示不可见的字符）：

"<p>Here's some \u00a0 <em>funny<\/em> \u00a0 text<\/p>"

All  字符已转换为 Unicode 不间断空格，这破坏了我的应用程序。

在我的理想世界中，有一种方法可以检索目标 div 内的原始 HTML 字符串as-is，没有DomDocument对它做任何事。这似乎不可能，所以下一个最好的办法是以某种方式关闭此字符转换。到目前为止我已经尝试过：

Setting $doc->substituteEntities = false;没有结果。将其更改为true也没有帮助。
切换$doc->preserveWhiteSpace无论如何都没有改变
改变saveXML to saveHTML。没有什么区别。

最后我求助于这个 hack，它有效，但感觉不是正确的解决方案。

$markup = str_replace("\xc2\xa0", '&nbsp;', $markup);

当然有更好的方法吗？

您可以使用mb_convert_encoding() https://www.php.net/manual/en/function.mb-convert-encoding.php将 Unicode 字符转换为其实体而不触及括号等：

<?php
$html = '
<div>...</div>
<div id="target"><p>Here\'s some &nbsp; <em>funny</em> &nbsp; text</p></div>
<div>...</div>
<div>...</div>
';

$doc = new DOMDocument();
libxml_use_internal_errors();
$doc->loadHTML("<html><body>$html</body></html>");
$node = $doc->getElementById('target');
$markup = '';
foreach ($node->childNodes as $child) {
  $markup .= $child->ownerDocument->saveHTML($child);
}

$markup = mb_convert_encoding($markup, 'HTML-ENTITIES', 'UTF-8');
echo $markup;

Output:

<p>Here's some &nbsp; <em>funny</em> &nbsp; text</p>

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

php

domdocument

如何防止 DOMDocument 转换为 unicode 的相关文章

php laravel Blade 模板不渲染

我正在尝试使用 Laravel 和 twitter bootstrap 设置一个基本页面我安装了 Laravel 并获得了通用的你在这里或 w e 图像这样看起来很闪亮对于 twitter bootstrap 我在 public
PHP 下载脚本输出损坏的文件

我正在用 PHP 为我的 CMS 构建一个文件下载类当时我注意到它以不同的编码格式输出文件我尝试使用 readfile file get contents fread 但似乎都在做同样的事情这就像与输出缓冲有关的东西我使用脚本下载的
SetInterval 函数不适用于 PHP 文件

我有这样的index html
Symfony2，如何向表单添加隐藏的日期类型字段？

我正在尝试以下场景 In myclassType public function buildForm FormBuilder builder array options builder gt add day hidden gt add da
YUI压缩机或类似的PHP？

我一直在我的测试服务器上使用 yuicompressor jar 来动态最小化已更改的 JavaScript 文件现在我已经将网站部署到公共服务器上我注意到服务器的策略禁止使用 exec 或其等效项因此我不再执行 java 有没有一个
如何使用 php DOM 获取内的值？

我如何使用 php DOM 获取内的值这是我的 xml 中的一些代码
PHP 电子邮件验证[重复]

这个问题在这里已经有答案了 For PHP最好的电子邮件验证方法是什么preg NOT ereg因为它是已弃用删除 I don t需要检查该网站是否存在这不像最高安全性我找到了很多方法ereg但它们显然不是好的做法我建议你使用F
php隐藏所有错误[重复]

这个问题在这里已经有答案了隐藏的最佳做法是什么allPHP 错误因为我不想向用户显示错误我尝试过使用 htacess通过输入代码php flag display errors off在那里但它返回给我一个500 error 还有其他
Zend RegEx Validator 的自定义有意义的错误消息

我正在验证表单中的文本字段如下所示 name new Zend Form Element Text name name gt setLabel First Name gt setRequired true gt addFilter new
在 PHP 中将整数转换为十六进制值

如何将PHP中第一类中的数字转换为第二类中的数字是否有内置函数来转换数字也是我的标题将整数转换为十六进制值甚至正确 class Permission const READ 1 const UPDATE 2 const DELETE
为什么 asort 适用于多维数组？

抱歉如果这是一个非常基本的问题我无意中发现asort http php net manual en function asort php似乎适用于多维数组示例 PHP animals array 1 gt array name gt
从检查元素隐藏 ''

我有这个 HTML 和 PHP 联系表
自定义 WordPress 画廊 html 布局

当使用默认媒体上传器在 WordPress 中创建图像库时 WordPress 将图像包装在一堆 HTML 标记中如何在生成之前覆盖它以便我可以输出所需的标记并更改创建图库布局的方式目前 WordPress 生成的代码如下 div d
将客户分配到 magento 的多个客户组

您好我想将多个组分配给特定客户例如 Rajat 客户属于批发零售商电力实际上我在上面看到了同样的话题每个客户有多个客户组 https stackoverflow com questions 6153011 multiple c
PHP-如何根据条件配对数组中的项目

如何将数组中的项目配对假设我有一个数组Fighters 我想根据他们的情况将他们配对Weights 体重最接近的拳手应作为配对最佳匹配但如果他们是在同一个团队中他们不应该配对团队 1 战斗机A体重为60 战斗机B体重为65 2队战
使用 Xpath 进行部分匹配

我正在尝试创建一个搜索功能允许使用 Xpath 按歌曲标题或流派进行部分匹配这是我的 XML 文件
sqlite3和pdo_sqlite有什么区别

我正在将我的 Web 应用程序从 MySQL 迁移到 SQLite 数据库我发现有两个 PHP 扩展用于与 sqlite 通信 php sqlite3 dll and php pdo sqlite dll 什么扩展比较好或者另一个问题
PHP 中根据相似值对数组进行分组

我有一个具有以下结构的数组
Mysql加密/存储敏感数据，

我的 PHP 网站有以下内容启用 SSL 饼干 session set cookie params cookieParams lifetime cookieParams path cookieParams domain secure ht
使用 Swift 邮件程序发送邮件时出现错误 501

随机推荐

如何从powershell获取返回值并将其放入批处理文件中？

我正在尝试使用命令从批处理文件执行 powershell Powershell namefile ps1 PowerShell 返回一些值 1 4 0 和 1 如何从批次中获取这些值当我使用 errorlevel 时它只返回0 这意味着
Delphi 快速应用程序开发在可重用性方面的最佳实践 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 使用Delphi开始新项目时如何提高
如何从 ASP NET Core 控制器获取 JWT 令牌？

我正在尝试向受保护的 API 发出请求因此我需要向 HttpClient 添加授权请求标头如下所示 client DefaultRequestHeaders Authorization new AuthenticationHeaderV
等待 Excel 使用 VBA 完成填充 Bloomberg 数据

我有一个包含约 300 000 个 BDH 公式的 Excel 工作表来下载证券价格我想要打开文件并获取所有价格将它们粘贴为值保存并关闭文件但是我不知道 Excel 何时完成填充 Bloomberg 数据因此很难确定执行 2
使用 DirectShow 获取 MP4 文件持续时间

我需要获取 mp4 文件的持续时间最好是以秒为单位的双倍时间我正在使用 DirectShow 请参阅下面的代码但它不断抛出一个特别无用的错误我想知道是否有人有一个简单的解决方案说真的谁知道获取这些信息会如此困难 public s
设置新发布管道时，Azure DevOps 服务连接不显示

我已在 Azure DevOps 中设置了到我的 Azure 订阅的服务连接它使用证书进行连接当我创建新管道并选择任务时Azure App Service Deploy 在 Azure 订阅的下拉框中我在可用 Azure 服务连接
使用 OpenCV 测量物体的表观长度（以像素为单位）

我用过从不同角度姿势渲染 3D 对象的不同图像该对象具有彩色边缘如图所示现在我的目标是测量橙色和蓝色边缘的长度 Lo 和 Lb 以像素为单位使用 OpenCV 如果边缘由单个像素组成即由单个边缘组成的线那么这将是一项简单的任
使用内部支持的优化器优化 scikit-learn 中 GPR 的 RBF 内核的内核参数

平方指数或RBF核的基本方程如下这里 l 是长度尺度 sigma 是方差参数长度比例控制两个点的相似程度因为它只是放大 x 和 x 之间的距离方差参数控制函数的平滑程度我想用我的训练数据集优化训练这些参数 l 和 sigma 我
如何以编程方式使 UIStackView 与 UIScrollView 一起滚动？

我见过几种解决方案UIStackView滚动UIScrollView但它们都依赖于 Autolayout 和 IB 有没有办法以编程方式做到这一点我看过这个例子 https gist github com twostraws a02d4c
使用 ElasticSearch 搜索全球位置名称的有效方法是什么？

我有以下提供的位置信息地名网 http www geonames org 解析成关系数据库使用这些信息我尝试构建一个 ElasticSearch 索引其中包含人口稠密的地名城市名称行政区划州省等名称国家地区名称和国家
Pandas 绘图在 x 轴上显示所有日期值（matplotlib 仅显示几个值），格式为 MM-YYYY [重复]

这个问题在这里已经有答案了 import os import pandas as pd import matplotlib pyplot as plt import datetime df pd read excel DATA DIR fi
在接受后配置 TCP keepalive

之后accept 在套接字上我正在尝试配置 TCP keepalive SockConnected accept SockListen RemoteAddr RemoteLen A bit of checking goes here if
单击复选框时 ASP.NET MVC 提交表单

当我想在单击复选框时提交表单时我应该在 ASP NET 中执行什么特殊操作吗这是我正在使用的一些示例 HTML
SimpleXML 构造函数异常 - 无法创建内部类

我刚刚开始尝试使用 SimpleXML 进行 Android 开发并认为一切进展顺利直到我遇到了障碍下面的代码产生一个异常 W System err 665 org simpleframework xml core Construct
如何将空格分隔的变量传递到bat 文件中？

我想将一个空格分隔的变量传递到批处理文件中例如 c applications mi pocess bat A1 1AA 当我跑步时echo 1 in mi process它返回A1 我将如何去认识它A1 1AA是一个单一的字符串我尝试过
为什么Django可以处理多个请求？

根据 Django 是同步的但是我测试了阻塞视图python manage py runserver 8100 import time action detail False methods get def test self reque
Cassandra cqlsh - 连接被拒绝

我刚刚开始使用 Cassandra datastax 版本 2 1 3 和 cqlsh 版本 5 0 1 Cassandra 启动正常集群可立即运行 Cqlsh 无法工作在任何节点上并发出以下错误连接错误无法连接到任何服务器 12
具有自定义文件名的 Blob 绑定

使用 Azure 函数的输出绑定到存储 Blob 我可以为存储 Blob 输出指定路径该路径要么是硬编码的要么可以使用特殊的模板示例 rand guid 有没有办法提供自定义模板来在函数执行期间指定值例如使用触发器队列消息 ID
/reference 选项中未指定外部别名“xxx”

不幸的是我有两个程序集在同一命名空间中定义了相同的类型我正在尝试使用extern alias http msdn microsoft com en us library yabyz3h4 aspx解决这个问题在 Visual Stud
如何防止 DOMDocument 转换为 unicode

我正在尝试获取 a 的内部 HTMLDOMElement在 PHP 中标记示例 div div div p Here s some nbsp em funny em nbsp text p div div div div div 将上面的

如何防止 DOMDocument 转换为 unicode

如何防止 DOMDocument 转换为 unicode 的相关文章

随机推荐

热门标签