构建输入文本区域以允许 HTML 但防止安全/脚本攻击

2023-11-21

平台:ASP.NET 4.0 MVC 4 C# jQuery

这就是我想做的。

我正在为我的产品建立一个简单的论坛。我想为用户提供一个文本区域来输入他们的帖子或评论。

  1. 我想允许基本文本格式 HTML 和链接 - 例如 p、a、b、i
  2. 不需要任何其他 html 样式 - 即 div、span 等。
  3. 不需要任何脚本访问权限

有什么聪明的方法可以做到这一点吗?例如,我可以允许不安全的文本并在服务器端检查它,但我怀疑我是否能够正确清理它并可能打开安全漏洞。

最好要避免重型插件。

Thanks!

(PS - 我最糟糕的后备方案是我只允许安全文本,即保持 ASP.NET 安全性,然后对链接使用特殊标记 - 例如 [link] [b] [i])


更新(2020 年 2 月): 微软的 AntiXSS 库在其 Sanitizer 类上包含一个名为 GetSafeHtmlFragment 的静态方法,该方法似乎可以完成此任务。 (建议来自@exploring.cheerily.impresses)


在 .NET 4.5+ 中或通过添加System.Web.Security.AntiXss对于旧版本的.NET,有一个很好的方法来解决这个问题。我们可以用[AllowHtml]和自定义注释属性在一起。该方法应将字符串内的 HTML 标记列入白名单并验证请求。

以下是此作业的自定义注释属性:

[AttributeUsage(AttributeTargets.Property | AttributeTargets.Field, Inherited = true, AllowMultiple = false)]
public sealed class RemoveScriptAttribute : ValidationAttribute
{
    public const string DefaultRegexPattern = @"\<((?=(?!\b(a|b|i|p)\b))(?=(?!\/\b(a|b|i|p)\b))).*?\>";

    public string RegexPattern { get; }

    public RemoveScriptAttribute(string regexPattern = null)
    {
        RegexPattern = regexPattern ?? DefaultRegexPattern;
    }

    protected override ValidationResult IsValid(object value, ValidationContext ctx)
    {
        var valueStr = value as string;
        if (valueStr != null)
        {
            var newVal = Regex.Replace(valueStr, RegexPattern, "", RegexOptions.IgnoreCase, new TimeSpan(0, 0, 0, 0, 250));

            if (newVal != valueStr)
            {
                var prop = ctx.ObjectType.GetProperty(ctx.MemberName);
                prop.SetValue(ctx.ObjectInstance, newVal);
            }
        }

        return null;
    }
}

然后你应该使用 [AllowHtml] 和 [RemoveScript] 属性来装饰你想要 HTML 的模型属性,如下所示:

public class MyModel
{
    [AllowHtml, RemoveScript]
    public string StringProperty { get; set; }
}

这将只允许 、、 和 html 标签获取它。所有其他标签都将被删除,但它足够智能,可以保留标签的内部文本。例如。如果您发送:

“这是John Smith输入的富文本。”

你最终会得到这个:

“这是 John Smith 输入的富文本。”

将更多 HTML 标签列入白名单也很容易。例如。如果你想接受


,更改DefaultRegexPattern(影响全局)或将修改后的 regexPattern 传递给实例RemoveScriptAttribute, 像这样:
[AllowHtml]
[RemoveScript(regexPattern: @"\<((?=(?!\b(a|b|i|p|u|br|hr)\b))(?=(?!\/\b(a|b|i|p|u)\b))).*?\>")]
public string Body { get; set; }
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

构建输入文本区域以允许 HTML 但防止安全/脚本攻击 的相关文章

随机推荐