正则表达式在尊重 CDATA 的同时转义 HTML 和符号

2023-11-23

我编写了一个内容管理系统，它使用服务器端正则表达式在页面响应发送到客户端浏览器之前对页面响应中的＆符号进行转义。正则表达式会注意已转义的或属于 HTML 实体一部分的 & 符号。例如，以下内容：


a & b, c &amp; d, &copy; 2009

更改为：


a &amp; b, c &amp; d, &copy; 2009

（仅第一个&被修改。）下面是正则表达式，它是从 Rails 助手获取并修改的：

html.gsub(/&(?!([a-zA-Z][a-zA-Z0-9]*|(#\d+));)/) { |special| ERB::Util::HTML_ESCAPE[special] }

虽然这很有效，但它确实有一个问题。正则表达式不知道任何<![CDATA[ or ]]>这可能围绕着未转义的 & 符号。这对于嵌入式 JavaScript 保持不变是必要的。例如，这个：

<script type="text/javascript">
  // <![CDATA[
  if (a && b) doSomething();
  // ]]>
</script>

不幸的是呈现为这样：

<script type="text/javascript">
  // <![CDATA[
  if (a &amp;&amp; b) doSomething();
  // ]]>
</script>

JavaScript 引擎当然无法理解。

我的问题是：有没有办法修改正则表达式，使其完全按照现在的方式执行，但它会使 CDATA 部分内的文本保持不变？

由于正则表达式一开始就不是那么简单，所以这个问题可能更容易回答：是否可以编写一个正则表达式，将除 ' 之间的字母之外的所有字母更改为句点<'和一个'>'？例如，一个会改变的"some <words> are < safe! >" into ".... <words> ... < safe! >"?

你自找的！：D

/&(?!(?:[a-zA-Z][a-zA-Z0-9]*|#\d+);)
 (?!(?>(?:(?!<!\[CDATA\[|\]\]>).)*)\]\]>)/xm

第一行是你原来的正则表达式。如果存在 CDATA 结束序列 (]]>）在前面，除非有一个开头序列（<!CDATA[）这里和那里之间。假设文档的格式最低限度良好，这应该意味着当前位置位于 CDATA 部分内。

哎呀，我有这种落后：通过使用积极的前瞻，我只在 CDATA 部分中匹配“裸”和符号。我将其更改为负前瞻，所以现在它可以正常工作了。

顺便说一句，这个正则表达式在 Ruby 模式下的 RegexBuddy 中工作，但在红状部位。我怀疑 Rubular 使用旧版本的 Ruby，其正则表达式支持功能较弱；谁能证实这一点？（您可能已经猜到，我不是 Ruby 程序员。）

编辑：Rubular 的问题是我使用 's' 作为修饰符（表示点匹配所有内容），但 Ruby 使用 'm' 来实现这一点。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

正则表达式在尊重 CDATA 的同时转义 HTML 和符号的相关文章

Rails 销毁除最新的 n 条记录之外的所有记录

如何使用 Rails 的 ActiveRecord 销毁除最新的 n 条记录之外的所有记录我可以使用 order 和 limit 获取最新的 n 条记录但如何销毁逆函数这些方法中的任何一个都可以做到这一点 Fetch your lat
如何从 php 中的字符串中删除 unicode 字符 (LEFT_TO_RIGHT_MARK)

我试图在将字符串编码为 JSON 之前从字符串中删除从左到右标记 u200e 和从右到左标记 u200f 以下两者似乎都不起作用 s mb ereg replace u200e s s preg replace u200e u s s pr
在 rspec 中打印响应

我有一个测试无法开始工作所以我想通过打印响应来调试我的规范我尝试过使用print response body在我的规范中但 test log 或控制台中都没有输出我可能错过了一些东西我应该尝试什么 Thanks 您可以使用以下方式
将 ERB 与 Handlebars 模板结合使用

我有一个使用 ajax 创建新标签的模式它使用 Tags 参数执行 POST 方法而无需重新充电视图因此我希望根据所选的 price type 参数来呈现一个或另一个价格 div 我使用 Handlebars 所以我想这不是 rub
正则表达式匹配组，但组成员除外

因此有许多正则表达式可以匹配特定的组如下所示 Any character except a newline m Any character the m modifier enables multiline mode w A word c
使用 PHP 将 HTML 片段包裹在 div 中（并从 HTML 标签生成目录）

我原来的 HTML 看起来像这样 h1 Page Title h1 h2 Title of segment one h2 img src img jpg alt An image of segment one p Paragraph one
学习树顶

我正在尝试自学 Ruby 的 Treetop 语法生成器我发现对于最好的文档来说不仅文档非常稀疏而且它的工作方式似乎并不像我希望的那样直观从高层次上来说我真的很喜欢比现场文档或视频更好的教程如果有的话在较低的层面上这是
Rube.exe：Babun 中没有这样的文件或目录

我正在尝试在 Babun 中安装 ruby gems 以便我可以安装 sass 和 compass 但不断收到错误 C RailsInstaller Ruby2 1 0 bin ruby exe No such file or direct
使用 regEx 验证属性名称

我想使用点表示法规则任何字母或数字以及 and 只要它不以数字开头显然如果使用括号表示法那么一切都是有效的我一直在尝试找出正则表达式解决方案但我对正则表达式的了解并不多我认为我当前的模式将允许字母数字 and 但我不知道如何禁止
安装 gem 失败并出现权限错误[重复]

这个问题在这里已经有答案了我昨天将 Mac 操作系统更新至 10 9 Mavericks 我当前的 Ruby 版本显示为 ruby 2 0 0p247 2013 06 27 修订版 41674 universal x86 64 darwi
表单提交按钮仅在重新加载后才有效

我有一个构建表的索引页我试图允许用户编辑表中的行我试图以最基本的方式做到这一点没有 javascript ajax 等除非 Rails 提供了它我的表在索引方法中显示良好并且有一个表单作为表中的最后一行可用于添加新行新的形式
如何停止 Heroku 服务器？

我有一个托管在 heroku 上的临时服务器我只想将其关闭但不想破坏该应用程序我该怎么做我是否有类似 heroku stop 之类的命令例如 heroku restart 来重新启动 OR 有没有办法让服务器在超过 750 小时免
Thor 可执行文件 - 忽略任务名称

雷神维基页面制作可执行文件 https github com wycats thor wiki Making An Executable 向您展示如何创建由 thor 支持的 CLI 命令如下所示 bash mythorcommand
RVM 无法通过 SSH 工作（作为一项功能）

我刚刚在 Debian 6 服务器上安装了 RVM 一开始没有任何问题但是在一切设置完成后我无法在终端中运行 RVM 我打字时收到的消息rvm use is RVM is not a function selecting rubies
为什么 Ruby 中两个用空格分隔的字符串连接在一起？

为什么这在 Ruby 中有效 foo bar gt foobar 我不确定为什么要连接字符串而不是给出语法错误我很好奇这是否是预期的行为以及解析器是否负责争论没有运算符的两个字符串被视为单个字符串或者语言定义本身指定了这种行为隐式
识别http链接并创建锚标记

我正在尝试解析一些字符串它嵌入了一些 http 链接我想使用 jquery 在此字符串中动态创建锚标记然后将它们显示在前端以便用户可以单击它们有没有办法做到这一点 Thanks 你可以这样做 function get the st
Rails 中带有 text_field 的逗号分隔数组

我有一些users可以有很多posts 并且每个帖子都可以有很多tags 我已经使用一个实现了拥有并属于许多帖子和标签之间的关系创建新帖子时用户可以使用逗号分隔的值列表对其进行标记就像在 SO 上发布新问题时一样如果任何标签尚不存在
正则表达式不匹配

我正在尝试以下代码 d byte x01 x00 x00 x00 x00 x00 x00 x00 x00 x00 x00 x80J x13 x80SQ x80L xe0 x80 x92 x80L x80H xe0 r regexp Must
Ruby on Rails - 复选框未保存到数据库？

我有一个迁移它使用布尔值并在其视图中生成一个复选框但是无论我单击什么保存到数据库的值都不会受到影响我的迁移看起来像这样 def self up create table blogposts do t t string title
Rails：统计用户未读通知的数量

我目前有一个处理用户活动通知系统的活动模型当发生某些操作例如创建新文章时活动观察者会创建一个新活动现在我想记录当前用户尚未看到的这些活动通知中有多少类似于 facebook 上的通知宝石每次用户单击通知链接时数字应重置为 0

随机推荐

如何在youtube embed api中监听seek事件

您好我正在使用 youtube iframe 嵌入 API 我想跟踪用户的搜索视频事件请帮助我如何跟踪这个没有简单的方法可以单独使用 api 来跟踪事件你可以做的是间隔运行一个javascript函数并检查测量的时间差是否与预期的不
Rails 可选 /:locale 路线

我正在尝试为我的 Rails 应用程序设置一个路由系统该系统允许将可选路由 locale 允许到网站的底部所以或多或少 en home 将转到与 home 相同的页面 en people gt people 我遇到的唯一问题是在路由配置
GoogleCertificatesRslt：Kotlin Android 应用程序中不允许

我正在开发一个使用 Kotlin 作为开发语言的 Android 应用程序该应用程序显示地图并应该加载标记但是地图会加载但标记不会加载我收到安全异常GoogleCertificatesRslt not allowed我发现这可能是
检测前景窗口何时发生变化

我知道哪个使用GetForegroundWindow函数我可以获取当前活动窗口句柄但是现在i want to detect when the active window of any application changes become
QTabWidget 大小取决于当前选项卡

I ve a QTabWidget 其中包含不同高度的小部件它们的宽度是固定的但是默认实现QTabWidget选择最大的部件的高度作为自己的高度我想知道是否有一种可能快速的方法来改变大小QTabWidget取决于其当前选项卡以
删除 Activity 作为默认启动器

我将我的活动设置为默认启动器来拦截主页按钮点击如下所示
AngularJS 中的滚动事件

我有一个带有滚动条的 div 现在我想获取一个事件每次用户滚动时都会触发该事件这在 AngularJS 中可能吗还是我必须使用 jQuery Edit 到目前为止我想出了以下内容 JS directive scroll functio
没有名为“fbprophet”的模块？

我尝试按照以下说明在 Ubuntu 上的 Anaconda 中安装 Facebook Prophet https facebook github io prophet docs installation html installation
pip 和 conda 之间的实际区别

我看到了有关 pip 和 conda 之间差异的其他问题但我还不清楚请在标记为重复之前考虑这一点如果我跑pip install seaborn and conda install seaborn我会得到同样的结果吗我可以跑pip i
更好的错误处理[重复]

这个问题在这里已经有答案了 Here https github com astaxie build web application with golang blob master en 11 1 md描述了如何根据 http 包使用自定义路
IPython 导入失败和 python sys.path 一般情况

我正在关注这个post让一个 ipython 统治所有 virtualenvs 据我了解这篇文章的主要思想是当在 virtualenv 中时 ipython 找不到它的模块 a virtualenv me pc ipython Trac
从服务器 HTTPS 接收并验证证书 - android

我正在通过 https 从 Android 客户端调用 Web 服务我必须验证从服务器端收到的证书我怎么做目前这是我用来调用网络服务的代码 private static String SendPost String url Arra
如何在 Jekyll 中链接到没有 html 扩展名的 page.url 页面？

我正在 Jekyll 中建立一个网站为了删除帖子中的 html 扩展名我将以下内容添加到 config yml permalink kb title 为了从页面中删除 html 扩展名我为每个页面创建了文件夹并在每个页面文件夹中放置
如何有条件地为表格单元格中的背景着色？

我正在渲染一个表格p 数据表 PrimeFaces 我想要做的是根据单元格内容的值对单元格的背景进行着色这与为行或列着色不同它是单个单元格首先是CSS问题如果我这样做
从 HTML 页面源下载图像文件

我正在编写一个抓取工具用于从 HTML 页面下载所有图像文件并将它们保存到特定文件夹中所有图像都是 HTML 页面的一部分下面是一些代码用于从提供的 URL 下载所有图像并将它们保存在指定的输出文件夹中您可以根据自己的需要对其进
Flutter widget 测试选择另一个项目时不会触发 DropdownButton.onChanged

我正在编写一个 Flutter Web 应用程序并向我的代码库添加一些小部件测试我很难让 flutter test 按预期工作我当前面临的问题是尝试在 DropdownButton 中选择一个值以下是重现问题的完整小部件测试代码 v
添加和删除 JLabel 上的图标

您好我有一个标签我已为其设置了图标我想在单击按钮后删除此图标它的方法是什么 Create icon Icon icon new ImageIcon getClass getResource foo bar baz png Creat
掩蔽者在 SHAP 包中真正做了什么并让他们适合训练或测试？

我一直在努力与shap包裹我想从我的逻辑回归模型中确定形状值与此相反TreeExplainer the LinearExplainer需要一个所谓的掩蔽器这个掩码器到底有什么作用独立掩码器和分区掩码器有什么区别另外我对测试集中的
Windows中当前目录和工作目录的区别

Windows 中的当前目录和工作目录有什么区别如何更改 Notepad 或 Mozilla Firefox 等应用程序的工作目录当前目录和工作目录只是同一事物的两个不同名称每个进程维护一个当前目录当前目录在启动时指定为用于创建进程
正则表达式在尊重 CDATA 的同时转义 HTML 和符号

我编写了一个内容管理系统它使用服务器端正则表达式在页面响应发送到客户端浏览器之前对页面响应中的符号进行转义正则表达式会注意已转义的或属于 HTML 实体一部分的符号例如以下内容 a b c amp d copy 2009 更改为

正则表达式在尊重 CDATA 的同时转义 HTML 和符号

正则表达式在尊重 CDATA 的同时转义 HTML 和符号 的相关文章

随机推荐

热门标签

正则表达式在尊重 CDATA 的同时转义 HTML 和符号的相关文章