可能的重复:
清理 Word HTML 的最佳免费方法是什么? https://stackoverflow.com/questions/67964/what-is-the-best-free-way-to-clean-up-word-html
PHP 清理粘贴的 Microsoft 输入 https://stackoverflow.com/questions/379342/php-to-clean-up-pasted-microsoft-input
我允许客户在富文本编辑器中输入注释,并且最近才升级到 ckEditor 3x,它默认删除 MS 词类、样式和注释(当用户粘贴到编辑器对象中时)。所以,继续前进,我已经准备好了。
我最近需要清理 5 年的笔记,其中一些嵌入了 MS Word 生成的 HTML。我需要遍历这段文本并清理它。
我不需要删除所有跨度标签,只需删除那些被标识为由 Microsoft 编写的标签。
我尝试过使用 HTMLCleaner,但它并没有删除 MS 生成的 HTML。http://word2cleanhtml.com http://word2cleanhtml.com正是我想要的,但是开发人员目前不提供 API 供公众使用(截至 2012 年 7 月 9 日)。
在过去的几周里,我断断续续地寻找这样的课程,但运气不佳。你们中有人找到了想要分享的有用课程吗?
http://htmlpurifier.org/ http://htmlpurifier.org/
这将做你想做的事。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)