â�� 在我的 purify 后的 html 中

2024-01-18

我有一个数据库,我正在重建表结构,这很糟糕,所以我将一些数据从一个表移植到另一个表。这些数据似乎是从 MSO 产品复制粘贴的,因此当我获取数据时,我使用 htmlpurifier 和 php 中的一些 str_replace 对其进行清理。这是清理功能:

   function clean_html($html) {
    $config = HTMLPurifier_Config::createDefault();
    $config->set('AutoFormat','RemoveEmpty',true);
    $config->set('HTML','AllowedAttributes','href,src');
    $config->set('HTML','AllowedElements','p,em,strong,a,ul,li,ol,img');
    $purifier = new HTMLPurifier($config);

    $html = $purifier->purify($html);

    $html = str_replace(' ',' ',$html);
    $html = str_replace("\r",'',$html);
    $html = str_replace("\n",'',$html);
    $html = str_replace("\t",'',$html);
    $html = str_replace('  ',' ',$html);
    $html = str_replace('<p> </p>','',$html);
    $html = str_replace(chr(160),' ',$html);

    return trim($html);
   }

但是,当我将结果放入新表并将其输出到 ckeditor 时,我得到了这三个字符。

然后我有一个 javascript 函数,调用该函数也可以从 ckeditor 的内容中删除特殊字符。它也不能清洁它

  function remove_special(str) {
    var rExps=[ /[\xC0-\xC2]/g, /[\xE0-\xE2]/g,
    /[\xC8-\xCA]/g, /[\xE8-\xEB]/g,
    /[\xCC-\xCE]/g, /[\xEC-\xEE]/g,
    /[\xD2-\xD4]/g, /[\xF2-\xF4]/g,
    /[\xD9-\xDB]/g, /[\xF9-\xFB]/g,
    /\xD1/,/\xF1/g,
    "/[\u00a0|\u1680|[\u2000-\u2009]|u200a|\u200b|\u2028|\u2029|\u202f|\u205f|\u3000|\xa0]/g", 
    /\u000b/g,'/[\u180e|\u000c]/g',
    /\u2013/g, /\u2014/g,
    /\xa9/g,/\xae/g,/\xb7/g,/\u2018/g,/\u2019/g,/\u201c/g,/\u201d/g,/\u2026/g];
    var repChar=['A','a','E','e','I','i','O','o','U','u','N','n',' ','\t','','-','--','(c)','(r)','*',"'","'",'"','"','...'];

    for(var i=0; i<rExps.length; i++) {
        str=str.replace(rExps[i],repChar[i]);
    }

      for (var x = 0; x < str.length; x++) {
    charcode = str.charCodeAt(x);
          if ((charcode < 32 || charcode > 126) && charcode !=10 && charcode != 13) {
              str = str.replace(str.charAt(x), "");
          }
      }
      return str;
  }

有谁知道我需要做什么才能摆脱它们。我认为它们可能是某种引言。


你的字符编码完全不正常。 â�� 对我来说表示三字节 UTF-8 编码字符。

有些事情你需要去发现

  • 旧表的编码是什么?
  • 新表的编码是什么?
  • 显示ckeditor的页面的编码是什么?

看起来像HTMLPurifier的默认编码是UTF-8 http://htmlpurifier.org/live/configdoc/plain.html#Core.Encoding所以你真的需要了解数据的编码!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

â�� 在我的 purify 后的 html 中 的相关文章

  • 如何使用JQuery调用SWAL中成功的函数?

    第二个功能不起作用 它没有收到从第一个函数传递的 id 这是我的 JQuery 代码 swal title Are you sure text You will not be able to recover this record type
  • 如何覆盖 phpunit 中导出的变量?

    我知道我可以设置环境变量 https phpunit de manual current en appendixes configuration html在我的 phpunit xml 里面
  • 解析 PHP 响应:未捕获的语法错误:意外的标记 <

    我正在使用 AJAX 来调用 PHP 脚本 我唯一需要从响应中解析的是脚本生成的随机 ID 问题是 PHP 脚本会引发许多错误 这些错误实际上很好 不会妨碍程序功能 唯一的问题是当我跑步时 parseJSON response I get
  • 在 WordPress 和 woocommerce 中禁用 zxcvbn.min.js

    如您所知 zxcvbn min js 约为 400kb 并且默认在 WordPress 网站中加载 我想知道如何阻止加载此 JavaScript 库 因为我不想在我的网站中检查密码长度 将以下内容添加到主题的 function php 或自
  • 需要使用 php 从远程服务器下载与 $_FILES 相同的内容[关闭]

    很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 help reopen questions 好的 我有处理图像上传的 php 代
  • 如何从代码隐藏文件中的asp.net用户控件注册(调用)jQuery函数?

    如何从代码隐藏文件中的asp net用户控件注册 调用 jQuery函数 您可以使用ClientScriptManager RegisterStartupScript http msdn microsoft com en us librar
  • 无需下载整个文件即可读取 ID3 标签

    是否可以读取 MP3 文件的 ID3 标签 持续时间 艺术家 标题 而无需下载整个文件 我做了一些测试 只需下载 MP3 文件的几个字节就可以获得艺术家和标题标签 但我不确定持续时间和其他标签是否可能 Thanks 我刚刚发现 ffmpeg
  • 第一个单词选择器

    如何选择 div 中的第一个单词 我需要能够在第一个单词后插入换行符 或者将其包装在 span 标记中 我需要对具有相同类的页面上的多个 div 执行此操作 替换 HTML 将导致事件处理程序解除绑定 替换元素的整个文本将导致 HTML 标
  • 将 MathJax 脚本添加到 Office 365 Sharepoint 中的页面

    我正在尝试将 Mathjax 库添加到 SharePoint 库 以便我们可以使用 LaTex 语法来添加方程 我在网上搜索时看到了多种方法 但似乎没有一种方法可以与最新版本的 MathJax 和 Office 365 版本的 ShareP
  • JavaScript 匿名函数语法

    下面两个块有什么区别 block 1 console log anonymous block block 2 function anon console log anonymous block 2 我在 Netbeans 中运行了这个 使用
  • 如何使用 PDO 动态构建查询

    我正在使用 PDO 并想做这样的事情 query dbh gt prepare SELECT FROM table WHERE column value query gt bindParam table tableName query gt
  • 使 div 的大小与其内部图像的大小相同

    我有一个带有以下代码的div HTML div img src img logo png div CSS div imgContainer width 250px height 250px padding 13px 问题是用户可以编辑图像大
  • 将 jQuery 单击处理程序添加到多个元素?

    我需要有一个for在我的 jQuery 中循环 Example for i 0 i
  • 使用js获取选择选项的onclick事件

    我有一个非常令人沮丧的问题 我有这个代码 它过滤掉我的结果并将它们输入到选择框中 var syn
  • 保存 dat.gui 预设以动态添加控件?

    我正在向 dat gui 界面动态添加控件 但 保存设置 功能无法识别它们 var mygui new dat GUI mygui remember mygui standard way of adding a control mygui
  • 哪个 PHP 5 版本最常用?

    当我开发将在不同配置的客户端 Web 服务 通常使用共享托管 上使用的应用程序时 我应该假设大多数 Web 服务器都具有哪个 PHP 5 版本 例如 5 2 x 5 3 x 等 在所有使用 PHP 版本 5 的网站中 有 84 9 使用版本
  • jQuery可排序发布数据,但没有数据

    谁能告诉我我在这里缺少什么 我的数据似乎总是空的 我做错了什么 document ready function nav sortable connectWith nav axis y update function event ui var
  • 如何在不刷新页面的情况下更新页面 html 和 url

    我想知道是否有人可以指出我学习如何在不刷新页面的情况下更新页面 html 和 url 的方向 是否有任何现有的 javascript 库可以处理这个问题 或者有一本涵盖此类事情的好书 这是使用该效果的示例网站 http onedesignc
  • 处理查询字符串参数时 Codeigniter 缓存问题

    问候 我正在编写一个 CI Web 应用程序 它实现标准文件缓存功能 如下所示 this gt output gt cache n 我使用了段和查询字符串参数的组合 因此似乎遇到了问题 我在用例和输出类代码中看到的是 缓存仅基于段 像这样
  • 如何在jsp页面中包含javascript

    我是 J2EE 和 Web 开发的新手 这是我的问题 我想在网页中包含 angular js 这是有效的版本 但我也想要一些本地的 javascript 文件 并且希望我想在本地目录中导入 angularjs

随机推荐

  • 如何在 VB.NET 中变换形状

    我试图首先绘制一个形状 我已经完成了 然后将其按照用户选择进行转换 例如 旋转到某个角度或缩放 显示原始形状和新转换的形状 我尝试了以下尝试旋转 Private Sub paint box Paint sender As Object e
  • 有谁知道如何检测 Nativescript 的方向变化?

    我为屏幕创建了两个 xml 文件 一个名为 login page port xml 另一个名为 login page land xaml 有没有办法以编程方式检测应用程序内的方向变化 谢谢 凯克斯 是的 有一种方法可以检测应用程序中的方向变
  • 在谷歌脚本中使用自定义顺序对列进行排序

    我正在使用脚本对谷歌表格中的两列进行排序 目前 两列都使用排序功能 我想知道是否可以对第一列使用自定义顺序 在这种情况下 OPEN YES NO 这是一个链接电子表格样本 https docs google com spreadsheets
  • 在 ViewPager 中使用选项卡时出现错误“Java.lang.IllegalStateException Activity has been destroy”

    我有一个在选项卡模式下使用 ActionBarSherlock 的应用程序 我有 5 个选项卡 每个选项卡的内容都是使用片段处理的 不过 对于 tab2 我有一个片段 其中的 xml 文件包含一个 ViewPager 元素 该元素又包含一些
  • 每个连接的 Netty 多线程

    我是 Netty 新手 我想开发一个服务器 旨在接收来自可能少数 假设最多有 2 个 客户端的请求 但是每个客户端都会不断地向服务器发送许多请求 服务器必须处理此类请求并响应客户端 因此 在这里我假设即使我配置了多个工作线程 它也可能没有用
  • std::any_cast() 和 std::get_if(std::variant) 是否绝对有必要将指针作为参数?

    For std any and std variant我们有函数来请求对象当前包含的值 返回nullptr如果请求不能被满足 就像dynamic cast does template
  • Logstash grok 过滤器配置用于 php monolog 多行(stacktrace)日志

    2018 02 12 09 15 43 development WARNING home page 2018 02 12 09 15 43 development INFO home page 2018 02 12 10 22 50 dev
  • 如何用 C++ 处理 DWG 文件

    我正在开发一个项目 需要从 C 中的 dwg 文件导入线条数据 并且很难知道从哪里开始 我看过这个http opendesign com files guestdownloads OpenDesign Specification for d
  • pyglet 将屏幕分辨率转换为变量

    有没有任何选项如何获取值height and width使用 pyglet 将屏幕转换为变量 我可以打印它 但无法提取这些值 import pyglet platform pyglet window get platform display
  • 如何平滑matplotlib等高线图?

    I have numpy array with this shape 33 10 When I plot contour I get ugly image like this while contour 似乎没有任何关于平滑或某种插值功能的
  • 在 DataFrame 中按多列条件删除行

    我有一个 pandas 数据框 我试图根据所选列的条件删除行 如果这些选择列中的值为零 则应删除这些行 这是一个例子 import pandas as pd t pd DataFrame a 1 0 0 2 b 1 2 0 0 c 1 2
  • 反编译 Adob​​e AIR 应用程序

    是否有反编译 Adob e AIR 应用程序的工具 我想检查它们在我制作的应用程序上如何工作 打包的 AIR 文件 带有 air 扩展名的文件 是 ZIP 文件 您可以使用任何 ZIP 程序将它们分开 但是 AIR 应用程序可以用 Flas
  • 将sql结果转换为列表python

    我是 python 初学者 我想将 sql 结果转换为列表 这是我的代码 cursor connnect db query SELECT FROM tbl cursor execute query options list for i ro
  • WebGl 将 float 打包到 v4 中

    我有来自 Threejs 示例的代码示例 http twojs org examples webgl animation cloth http threejs org examples webgl animation cloth 5D其中浮
  • Matlab:如何将元胞数组转换为字符串数组?

    我有一个大小为 14676x117 的元胞数组调用myCellArray 我想提取存储在中的值myCellArray 2 14676 1 在字符串数组中 运行下面的脚本仅返回单个字符串值 而不返回字符串数组 gt gt y myCellAr
  • 我应该使用什么 SQL Server 数据类型来存储字节[]

    我想在我的 SQL Server 中存储一个字节数组 您建议使用什么数据类型或预插入操作来存储这些数据 我没想到这些byte 长度超过 1024 varbinary 1024 这就是您正在寻找的 SQL Server 中的二进制值存储有以下
  • Azure Web 应用程序容器和 docker 命令

    我将 Azure 资源 容器的 Web 应用程序 与 Linux docker 映像一起使用 我想使用 docker 命令 例如 dockerspect 但我不确定这是如何实现的 通过 Kudo 界面 这似乎不可能 我什至无法获取当前部署的
  • 禁用选项卡栏项目 - Swift

    如何禁用特定选项卡栏项目 就像第三个图标一样 self tabBarItem items 2 enabled false 一定有一种方法可以完成像单行这样简单的任务吗 上面的不行 这是答案 if let arrayOfTabBarItems
  • C# 从 JSON 响应创建 Deedle DataFrame

    我在将此请求的 JSON 响应加载到 Deedle DataFrame 中时遇到了一些问题 在 JSON 中 我感兴趣的是它的特性 更具体地说 对于每个功能都有属性 我本质上只想将这些属性的集合加载到 DataFrame 中 在这种特殊情况
  • â�� 在我的 purify 后的 html 中

    我有一个数据库 我正在重建表结构 这很糟糕 所以我将一些数据从一个表移植到另一个表 这些数据似乎是从 MSO 产品复制粘贴的 因此当我获取数据时 我使用 htmlpurifier 和 php 中的一些 str replace 对其进行清理