我尝试了几种方法来找出 html 字符串的哪一部分无效
$dom->loadHTML($badHtml);
$tidy->cleanRepair();
simplexml_load_string($badHtml);
没有人明确说明 html 的哪一部分无效。也许其中之一的额外配置选项可以解决这个问题。有任何想法吗 ?
我需要这个来手动修复用户的 html 输入。我不想依赖自动化流程。
我会尝试将有问题的 HTML 加载到 DOM 文档中(正如您已经在做的那样),然后使用 simplexml 来修复问题。您应该能够运行快速比较来查看错误所在。
error_reporting(0);
$badHTML = '<p>Some <em><strong>badly</em> nested</stong> tags</p>';
$doc = new DOMDocument();
$doc->encoding = 'UTF-8';
$doc->loadHTML($badHTML);
$goodHTML = simplexml_import_dom($doc)->asXML();
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)