Python：使用“lxml.html”将 HTML 内容注入到标签中

2024-01-15

我正在使用lxml.html解析 HTML 文档的库。

我找到了一个特定的标签，我称之为content_tag，并且我想更改其内容（即之间的文本<div> and </div>,) 新内容是一个字符串，其中包含一些 html，比如说'Hello <b>world!</b>'.

我怎么做？我试过content_tag.text = 'Hello <b>world!</b>'但随后它转义了所有 html 标签，替换< with < etc.

我想插入文本without转义任何 HTML。我怎样才能做到这一点？

这是一种方法：

#!/usr/bin/env python2.6
from lxml.html import fromstring, tostring
from lxml.html import builder as E
fragment = """\
<div id="outer">
  <div id="inner">This is div.</div>
</div>"""

div = fromstring(fragment)
print tostring(div)
# <div id="outer">
#   <div id="inner">This is div.</div>
# </div>
div.replace(div.get_element_by_id('inner'), E.DIV('Hello ', E.B('world!')))
print tostring(div)
# <div id="outer">
#   <div>Hello <b>world!</b></div></div>

也可以看看：http://lxml.de/lxmlhtml.html#creating-html-with-the-e-factory http://lxml.de/lxmlhtml.html#creating-html-with-the-e-factory

Edit:所以，我应该早点承认我对 lxml 不太熟悉。我简要查看了文档和源代码，但没有找到干净的解决方案。也许，更熟悉的人会过来并纠正我们俩的错误。

与此同时，这似乎有效，但尚未经过充分测试：

import lxml.html
content_tag = lxml.html.fromstring('<div>Goodbye.</div>')
content_tag.text = '' # assumes only text to start
for elem in lxml.html.fragments_fromstring('Hello <b>world!</b>'):
    if type(elem) == str: #but, only the first?
        content_tag.text += elem
    else:
        content_tag.append(elem)
print lxml.html.tostring(content_tag)

再次编辑：这个版本删除了文本和子项

somehtml = 'Hello <b>world!</b>'
# purge element contents
content_tag.text = ''
for child in content_tag.getchildren():
    content_tag.remove(child)

fragments = lxml.html.fragments_fromstring(somehtml)
if type(fragments[0]) == str:
    content_tag.text = fragments.pop(0)
content_tag.extend(fragments)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

html

Parsing

lxml

Python：使用“lxml.html”将 HTML 内容注入到标签中的相关文章

将 numpy 数组及其大小写入二进制文件

我需要将 2D numpy 数组写入文件包括其尺寸以便我可以从 C 程序中读取它并创建相应的数组我编写了一些简单的代码来保存数组并且可以从 C 读取它但是如果我尝试先写入数组的大小它总是会给我一个错误这是我的简单 python
获取输入图像类型选择的图片并加载到图像标签中

所以我有一个用于上传 img 文件的输入框我想要做的是从该数据或选定的源中获取数据并将其路由到图像标签的 src 属性中像这样的东西 http jsfiddle net QC2c4 http jsfiddle net QC2c4
python win32com.client 调整窗口大小

我正在使用 Python 3 4 1 通过 win32com client 控制 Windows 应用程序我可以激活它我可以发送击键点击等现在我想知道是否有办法调整窗口大小并将其设置到特定位置我找不到方法这里有一些代码片段所以
如何去除html源代码中的空格

我正在使用 django 和 python 在模板文件中我有一个下拉列表如下所示有用唯一的问题是源 html 代码之间有很多空白有什么办法可以去除空白吗谢谢 for lang ele in video languages all
关于具有自定义损失的 3 输出 ANN 的加权

我正在尝试定义一个自定义损失函数它在回归模型中接收 3 个输出变量 def custom loss y true y pred y true c K cast y true float32 Shape batch size 3 y pre
按升序对数字字符串列表进行排序

我创建了一个SQLite https en wikipedia org wiki SQLite数据库有一个存储温度值的表第一次将温度值按升序写入数据库然后我将数据库中的温度值读入列表中然后将该列表添加到组合框中以选择温度效果很好
Plotly：如何设置文本格式（下划线、粗体、斜体）

使用注释时我尝试在绘图中为文本添加下划线我使用添加注释 import plotly graph objects as go g go FigureWidget make subplots rows 1 cols 1 g update l
将可点击的锚标记转换为 html 文档中的纯文本

我正在尝试匹配 a 我的内容中的标签并将其替换为链接文本后跟打印版本的方括号中的 url 如果只有 href 则以下示例有效如果 a 包含另一个属性它匹配太多并且不会返回所需的结果我怎样才能匹配 URL 和链接文本就是这样这是
在添加数据之前使用 Python gdata 清除工作表中的行

我有一个 Google 电子表格我使用 python 脚本和 gdata 库填充值如果我多次运行脚本它会将新行附加到工作表中我希望脚本在填充之前首先清除行中的所有数据这样每次运行时我都会有一组新的数据脚本我尝试过使用 Updat
类型错误：无法连接“str”和“int”对象有人可以帮助新手使用他们的代码吗？

感谢任何帮助还有任何重大缺陷或您在格式或基本方面看到的任何重大缺陷请指出谢谢 day raw input How many days locations raw input Where to days str day location
在 Keras 中使用有状态 LSTM 训练多变量多级数回归问题

我有时间序列P过程每个过程的长度各不相同但都有 5 个变量维度我试图预测测试过程的估计寿命我正在用有状态的方法来解决这个问题LSTM在喀拉斯但我不确定我的训练过程是否正确我将每个序列分成长度的批次30 所以每个序列都是这样的形
numpy 向量化而不是 for 循环

我用 Python 写了一些代码运行良好但速度很慢我认为是由于 for 循环我希望可以使用 numpy 命令加速以下操作让我定义目标假设我有一个 2D numpy 数组all CMs尺寸row x col 例如考虑一个6x11数
数据类和属性装饰器

我一直在阅读 Python 3 7 的数据类作为命名元组的替代品我通常在必须将数据分组到结构中时使用它我想知道数据类是否与属性装饰器兼容以便为数据类的数据元素定义 getter 和 setter 函数如果是这样是否在某处进行了描
我应该在哪里对对象和字段进行 django 验证？

我正在创建一个 Django 应用程序它使用 Django Rest Framework 和普通的 django views 作为用户的入口点我想对模型的独立字段以及整个对象进行验证例如字段根据正则表达式函数输入的车牌是否正确与
将整数转换为特定格式的十六进制字符串

我是 python 新手有以下问题我需要将整数转换为 6 个字节的十六进制字符串例如 281473900746245 gt xFF xFF xBF xDE x16 x05 十六进制字符串的格式很重要 int 值的长度是可变的格式 0
如何通过 API Gateway 使用事件调用类型调用 Lambda 函数？

文件说默认情况下 Invoke API 采用 RequestResponse 调用类型您可以选择通过将 Event 指定为 InitationType 来请求异步执行因此我可以发送到我的函数 python 的就是到处都是 Inspi
阻止 BeautifulSoup 将我的 XML 标签转换为小写

我正在使用 BeautifulStoneSoup 来解析 XML 文档并更改一些属性我注意到它会自动将所有 XML 标签转换为小写例如我的源文件有
如何将另一整列作为参数传递给 pandas fillna()

我想用另一列中的值填充一列中的缺失值使用fillna方法我读到循环遍历每一行将是非常糟糕的做法最好一次完成所有事情但我不知道如何使用fillna 之前的数据 Day Cat1 Cat2 1 cat mouse 2 dog eleph
Python 中的可逆 STFT 和 ISTFT

有没有通用的形式短时傅立叶变换 https en wikipedia org wiki Short time Fourier transform与内置于 SciPy 或 NumPy 或其他什么中的相应逆变换这是pyplotspecgram
Rebol / Red Parse html规则返回true但没有插入任何内容

我有一个返回 true 的解析规则但它没有按预期插入我的文本 html 未更改而它应该插入到主结束 div 的末尾我尝试使用类似的计数器如何使用 REBOL 解析 HTML 标签内部 https stackoverflow com q

随机推荐

用于匹配/查找单元格中字符串的一部分是否等于给定范围内的值并返回该值的公式

我在 Excel 的两列中有两个文本范围如下所示 A B C 1 Mazda Mazda6 i Escape 2 Ford F150 XL Pathfinder 3 Ford Freestar SEL
在 iOS 7 上纵向裁剪图像会导致方向错误

我有以下功能在 iOS 7 和 XCode 5 之前它按预期工作该函数采用图像和cropSize 该图像是要裁剪为指定尺寸的图像该尺寸由 CGSizecropSize 定义该函数的目的是将图像裁剪到一定大小然后返回裁剪后的图像 U
纯SwiftUI登录、注册、注册流程，可以吗？

我是 ios 开发新手直接接触了 SwiftUI 和 Xcode 12 我试图了解从登录屏幕登录的流程在输入凭据后您将看到一个选项卡视图屏幕当应用程序首次加载时会显示登录信息登录成功后将返回并保存来自服务器的令牌并进一步启动
如何在 C 中找到可用的端口？

操作系统是Linux 我有一个可以实时更改其端口的服务器进程但是我想在绑定之前提前知道端口是否空闲场景服务器绑定 localhost 5000 并收到绑定 localhost 6000 的请求服务器必须检查端口是否空闲此问题寻求提
如何更改 rmarkdown 单元格中的 css 和闪亮？

我相对较新r并创造传单情节为此我需要一个白色背景代替grey 我遇到了这个SO发布相同内容传单地图的空白白色背景 https stackoverflow com questions 45989920 blank white backgr
jquery：在特定部分输入Tab触发器

我目前在也许简单的编程中遇到问题我是 jquery 的新手这些是我的代码 text keyup function e if e keyCode 13 alert Enter key was pressed this trigger
处理 WorkManager 对网络连接失败的响应

我正在使用 WorkManager 将数据从本地 Room 数据库同步到服务器问题是 Room 在 Loop MainLooper 中构建数据库时出错当我按照以下方式使用它时它工作正常但我无法根据任务完成情况在成功或重试时返回 Wo
如何通过.bat文件运行Java应用程序[重复]

这个问题在这里已经有答案了我需要通过 bat 文件运行我的 Java 应用程序只需创建一个包含以下行的 bat 文件 ECHO OFF set CLASSPATH set CLASSPATH CLASSPATH path to need
在 python 脚本中加载环境模块

有没有办法让Python脚本加载和使用环境模块 http modules sourceforge net os system module load xxx 不起作用因为它在子 shell 中执行它们至少我认为这就是发生的情况我知道
htmlspecialchars() 期望参数 1 为字符串，对象在 COdeIgniter 中给出错误

将类型转换数组分配给 codeigniter 会话时出现此错误 A PHP Error was encountered Severity Warning Message htmlspecialchars expects parameter
响应式网站适用于桌面设备，但不适用于移动设备

我正在开发这个响应式 WordPress 网站 http www allisoncassels com Test http www allisoncassels com Test 我的媒体查询有问题我为以下断点编写了 CSS 代码 Por
使用带有多个分隔符的 String.split()

我需要根据分隔符分割字符串 and 以下是我想要的输出 AA BB CC DD zip gt AA BB CC DD zip 但我的以下代码不起作用 private void getId String pdfName String toke
头文件的包含是如何发生的？

我有一个纯 C 代码工作区中有 c 和 h 文件我有一个头文件 1 h 声明一些结构为 struct my1 int a my t 但是当我尝试在另一个头文件 2 h 中声明类型为 struct my1 的变量时如下所示 struct
使视图变暗，就像禁用一样

如何使视图变暗就好像它被禁用突出显示一样最好不使用任何其他视图我所说的视图是指UIView 及其所有孩子我想达到禁用突出显示相同的效果UIButton 不要假设视图是完全不透明的我目前正在玩的创建一个不透明的黑色图层 hig
在 bootstrap-vue modal (b-modal) int 测试中找不到按钮

我想在我的测试用例中测试模态行为通过页面上的按钮打开模式 isVisible false gt true 通过模态上的按钮关闭模态可见 true gt false 第一步是可以的但是第二步就失败了我可以通过ref找到模态但我找不到
我可以强制 svcutil.exe 为 WCF 服务生成数据协定吗？

我愿意强行svcutil生成 WCF 使用的程序集中的所有数据协定无论给定操作协定是否引用类型 DataContract public class Foo DataContract public class Bar Foo Service
java 集合排序的绑定不匹配

您好需要有关 java 集合排序的帮助它给了我这个错误 Bound mismatch The generic method sort List
如何从丢失的树和悬挂的斑点中恢复文件？

After git add I ran git rm r f 并且我的所有本地文件都被意外删除恢复它们后git fsck lost found I have this http paste ubuntu com 26162239 in l
如何将 0000-00-00 00:00:00 值的日期时间设置为 NULL？

我需要更改数据库上的一些值我忘记为表设置可为空默认设置为 0000 00 00 00 00 00 现在我需要将该值转换为NULL 字段类型为日期时间我该怎么做我尝试使用典型的Update table set field NULL W
Python：使用“lxml.html”将 HTML 内容注入到标签中

我正在使用lxml html解析 HTML 文档的库我找到了一个特定的标签我称之为content tag 并且我想更改其内容即之间的文本 div and div 新内容是一个字符串其中包含一些 html 比如说 Hello b wo

Python：使用“lxml.html”将 HTML 内容注入到标签中

Python：使用“lxml.html”将 HTML 内容注入到标签中 的相关文章

随机推荐

热门标签

Python：使用“lxml.html”将 HTML 内容注入到标签中的相关文章