在 Python 中允许 Markdown，同时防止 XSS 攻击的最佳实践？

2024-01-06

我需要让用户将 Markdown 内容输入到我的 Web 应用程序中，该应用程序具有 Python 后端。我不想不必要地限制他们的条目（例如不允许anyHTML，这违背了 Markdown 的精神和规范），但显然我需要防止跨站脚本（XSS）攻击。

我不可能是第一个遇到这个问题的人，但没有看到任何包含所有关键字“python”、“Markdown”和“XSS”的问题，所以这里是。

使用 Python 库处理 Markdown 和防止 XSS 攻击的最佳实践方法是什么？（支持奖励积分PHP Markdown 额外 http://michelf.com/projects/php-markdown/extra/句法。）

我无法确定“最佳实践”，但通常在接受 Markdown 输入时有三种选择：

允许在 Markdown 内容中使用 HTML（这是 Markdown 最初/官方的工作方式，但如果处理不当，这可能会引发 XSS 攻击）。
只需将任何 HTML 视为纯文本，本质上是让您的 Markdown 处理器转义用户的输入。因此…输入中不会创建小文本，而是创建文字文本“…”.
丢弃 Markdown 中的所有 HTML 标签。这对用户来说非常不利，并且可能会因为诸如<3取决于实施。这是 Stack Overflow 上采用的方法。

我的问题具体涉及案例#1。

鉴于，什么对我有用正在通过发送用户输入

Python 的 Markdown https://pythonhosted.org/Markdown/，其中可选支持额外语法 https://pythonhosted.org/Markdown/extensions/extra.html然后通过
html5lib https://github.com/html5lib的消毒剂.

我对这个组合进行了一系列 XSS 攻击尝试，但都失败了（万岁！）；但使用像这样的良性标签工作完美。

这样，您实际上可以使用选项 #1（根据需要），但潜在危险或格式错误的 HTML 片段除外，这些片段将按选项 #2 进行处理。

（感谢 Y.H Wong 为我指明了 Markdown 库的方向！）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Xss

markdown

sanitization

在 Python 中允许 Markdown，同时防止 XSS 攻击的最佳实践？的相关文章

在二维数组中进行所有可能的组合

我正在尝试制作具有所有可能组合的 4x4 16 像素黑白图像数组我制作了以下数组作为模板 template 0 0 0 0 start with all white pixels 0 0 0 0 0 0 0 0 0 0 0 0 然后我想迭
在 SQLAlchemy 中，过滤器是在连接之前还是之后应用？

使用 SQLAlchemy 我执行如下查询 import models as m import sqlalchemy as sa s session maker q s query m ShareCount m Article join m
virtualenvwrapper 函数在 shell 脚本中不可用

所以我再一次制作了一个很棒的 python 程序它让我的生活变得更加轻松并节省了大量时间当然这涉及到一个 virtualenv 用mkvirtualenvvirtualenvwrapper 的功能该项目有一个requiremen
有什么好的适用于 Google App Engine 应用程序的 AJAX 框架吗？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在尝试在我的 Google App Engine 应用程序中实现 AJAX 因此我正在寻找一个好的
NumPy 数组与 SQLite

我在 Python 中见过的最常见的 SQLite 接口是sqlite3 但是有什么东西可以很好地与 NumPy 数组或 rearray 配合使用吗我的意思是它可以识别数据类型不需要逐行插入并提取到 NumPy rec 数组中有点
在多核上运行 python 线程

我知道Python 2 7不允许在不同的内核上运行多个线程你需要使用multiprocessing模块以实现某种程度的并发性我正在看concurrent futuresPython 3 4 中的模块是否使用ThreadPoolExec
matplotlib：渲染到缓冲区/访问像素数据

我想使用 matplotlib 生成的图作为 OpenGL 中的纹理到目前为止我遇到的 matplotlib 的 OpenGL 后端要么不成熟要么已经停止使用所以我想避免使用它们我当前的方法是将图形保存到临时 png 文件中并从
argparse 不检查位置参数

我正在创建一个脚本它使用 argparse 接受位置参数和可选参数我已经阅读了 Doug 的教程和 python 文档但找不到答案 parser argparse ArgumentParser description script t
Python FTP下载550错误

我编写了一个 ftp 爬虫来下载特定文件它会一直工作直到找到要下载的特定文件然后抛出此错误 ftplib error perm 550 该文件存在于我的下载文件夹中但文件大小为 0 kb 我需要转换某些内容才能下载吗我可以访问 f
当元组列表中相同项目的值是字符串时，对它们的值求和

如果我有这样的元组列表 my list books 5 books 10 ink 20 paper 15 paper 20 paper 15 我怎样才能把列表变成这样 books 15 ink 20 paper 50 即添加同一项目的费用
在python中使用编解码器utf-8打开文件错误

我在 windows xp 和 python 2 6 4 上执行以下代码但它显示 IOError 如何打开名称带有 utf 8 编解码器的文件 gt gt gt open unicode txt euc kr encode utf 8 T
将 str.contains 映射到 pandas DataFrame

python 初学者我正在寻找创建字符串的字典映射以及关联的值我有一个数据框想要创建一个新列如果字符串匹配则会将该列标记为 x df pd DataFrame comp dell notebook dell notebook S3
为什么我无法杀死 k8s pod 中的 python 进程？

我试图杀死一个 python 进程 ps aux grep python root 1 12 6 2 1 2234740 1332316 Ssl 20 04 19 36 usr bin python3 batch run py root 4
如何将 django ModelForm 字段显示为不可编辑

接受我的初步教训django ModelForm 我想让用户能够编辑博客中的条目 BlogEntry has a date postedTime title and content 我想向用户展示一个编辑表单其中显示所有这些字段但仅包含
如何在类型提示中定义元组或列表的大小

有没有办法在参数的类型提示中定义元组或列表的大小目前我正在使用这样的东西 from typing import List Optional Tuple def function name self list1 List Class1 if
带 Qt 的菜单栏/系统托盘应用程序

我是 Qt PyQt 的新手我正在尝试制作一个应用程序其功能将从菜单栏系统托盘执行这里展示了一个完美的例子我找不到关于如何做到这一点的好资源有人可以建议吗 Thanks 我认为您正在寻找与QMenu and QMainWindo
Django 中使用外键的抽象基类继承

我正在尝试在 Django 支持的网站上进行模型继承以遵守 DRY 我的目标是使用一个名为 BasicCompany 的抽象基类来为三个子类提供通用信息 Butcher Baker CandlestickMaker 它们位于各自的应用程序
关闭正在运行代码的 IPython Notebook

怎么运行的我在 IPython Notebook 中运行了一些代码一些迭代工作我不小心关闭了正在运行的笔记本的浏览器但回到 IPython 仪表板我发现这个特定的笔记本尚未关闭所以如果我再次打开笔记本我会在它正在执行的代码前面
在自定义 keras 层的调用函数中传递附加参数

我创建了一个自定义 keras 层目的是在推理过程中手动更改前一层的激活以下是基本层它只是将激活值乘以一个数字 import numpy as np from keras import backend as K from keras
如何使用 keras.backend.gradients() 获取梯度值

我试图获得 Keras 模型的输出相对于模型输入 x 而不是权重的导数似乎最简单的方法是使用 keras backend 中的梯度它返回梯度张量 https keras io backend https keras io backe

随机推荐

如何使用 Maven 程序集插件 jar-with-dependencies 在 JAR 中包含自定义文件

我需要在最终的 JAR 中包含自定义文件 com app log4 properties 使用 jar with dependencies 时如何将一个文件添加到我的 JAR 中现在该 JAR 中只有类文件我在用着 mvn assemb
如何对对象进行版本控制？

为了解释这一点请查看下面正在更改的对象 obj a 1 b 2 Version 1 obj a 2 Version 2 obj c 3 Version 3 我希望能够获得该对象的任何这些版本例如得到obj从版本 2 开始我不想每次更新
Rails 3.1：如何仅为 Web 应用程序运行初始化程序（rails 服务器/unicorn/等）

我的网络应用程序需要加密其会话数据我设置的是 config initializers encryptor rb require openssl require myapp encryptor MyApp Encryptor config
中断运行nashorn脚本的java线程

在下面的代码中我让 JavaScript 在与主线程不同的单独线程中运行该脚本是一个无限循环因此需要以某种方式终止它如何脚本开始运行后调用 cancel 不起作用但如果我在线程初始化后调用 cancel 它将终止它注释掉的行
Capistrano 和从 Github 部署网站

因此我有一个我认为相当简单的 Capistrano 用例我想从 Github 部署一个 PHP 站点但我遇到了很多问题当我跑步时cap deploy Capistrano 能够克隆 Github 存储库 deploy update
卡夫卡消费者偏移最大值？

我正在谷歌搜索并阅读 Kafka 文档但我无法找到消费者偏移量的最大值以及最大值之后是否存在偏移量环绕我知道 offset 是一个 Int64 值所以最大值是 0xFFFFFFFFFFFFFFFF 如果存在wraparound Kaf
我可以使用 Eclipse 将 JavaDoc 轻松添加到包中吗？

我使用 javadoc 来记录我的类和方法我也想在我的包中添加一些概述信息我喜欢 Eclipse 在我输入后为每个类或方法创建匹配文档注释的存根
获取ttk.Frame的默认背景

我通过调整这个将滚动条与 ttk 笔记本结合起来example https stackoverflow com questions 3085696 adding a scrollbar to a grid of widgets in tki
App.config dllmap条目可移植性

dllmap 配置文件条目在 Mono 中用于将对 Windows DLL 的请求映射到 Linux so 库但似乎如果 Microsoft 的 NET 框架尝试解析具有此类条目的配置文件则会发生错误因为它不理解 dllmap 我认为
“data.Length==0”或“data==string.Empty”哪个更有效？

我想检查是否有变量字符串data包含空字符串哪个效率更高 data Length 0 or data string Empty 我忘了说 data已经检查过保证不是null 1亿次迭代的测试结果 Equality operator 79
用于从 H/W 寄存器读取的位字段

我想从32位寄存器中读取第2位第5位和第6位我决定使用结构位字段来存储它们下面的数据结构正确吗 struct readData int unwanted 1 int reqbit1 1 int unwanted1 2 int reqb
Worksheet.Protect AllowDeletingRows 不允许删除行

在我的工作簿中我使用以下代码保护 Workbook Open 上的所有工作表 ws Protect Password password UserInterFaceOnly True AllowFormattingColumns True
Android Lunar Lander 线程处理替代方案

和许多 Android 编程新手一样我使用 Lunar Lander 作为实现 SurfaceView 的指南我正在通过创建 PONG 版本来练习代码的基本结构与LunarLander相同显然我很快就发现了月球着陆器中的错误我解
响应返回给客户端后进行清理

Context 我有一个用于下载 zip 存档的端点 GetMapping public DeferredResult
导航屏幕时，BottomTabNavigator 内的 StackNavigator 会重新呈现

我有一个Tab Navigator The Tabs包含Stack Navigators 代码结构为 Tab createBottomTabNavigator HomeStack createStackNavigator SettingSt
PHP：在单词边界处截断文本

有谁知道 Drupal 用于转换以下字符串的函数的确切名称你好你好吗再发一些短信 into 你好 IE 该函数用于在 x 个单词之后截断句子然后添加省略号或者如果有人有一个 php 片段可以做到这一点那就太好了 functio
尽管设置了 CC 和 CXX 变量，C 编译器识别仍未知

我正在使用命令 cmake CC C Program Files x86 Microsoft Visual Studio 12 0 VC bin cl exe CXX C Program Files x86 Microsoft Visual
使用 pip 安装时出现 Transport_encoding 错误

在尝试通过 pip 安装任何 python 包时我在 parse 中遇到意外的 arg 关键字编码自从我安装了 python 3 6 的tensorflow以来我遇到了这个问题这可能导致 html5lib 和 setuptools
如何在 UWP 中执行相对源模式查找祖先（或等效项）

我正在尝试做一些人们认为应该非常简单的事情至少在 WPF 中是这样我有一个带有列表框和数据模板的页面现在数据模板调用其中带有按钮的用户控件没什么花哨的但是按钮命令不是列表框源的一部分而且我找不到一种简单的方法来告诉按钮在哪里寻找
在 Python 中允许 Markdown，同时防止 XSS 攻击的最佳实践？

我需要让用户将 Markdown 内容输入到我的 Web 应用程序中该应用程序具有 Python 后端我不想不必要地限制他们的条目例如不允许anyHTML 这违背了 Markdown 的精神和规范但显然我需要防止跨站脚本 XSS 攻

在 Python 中允许 Markdown，同时防止 XSS 攻击的最佳实践？

在 Python 中允许 Markdown，同时防止 XSS 攻击的最佳实践？ 的相关文章

随机推荐

热门标签

在 Python 中允许 Markdown，同时防止 XSS 攻击的最佳实践？的相关文章