如何从 lxml 获取原始 XML？

2023-11-27

我使用以下代码来定位 div：

parser = etree.HTMLParser()
tree = etree.parse(StringIO(page), parser)

div = tree.xpath("//div[@class='content']")[0]

我唯一的问题是，执行此操作后，我不想依赖 lxml 来提取所述 div 的内容：我只想取回 div 包含的原始 XML。这是可行的还是我必须完全放弃这种方法？

我想您正在寻找：

etree.tostring(div)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

xml

htmlparsing

lxml

如何从 lxml 获取原始 XML？的相关文章

如何生成大型网站的图形站点地图[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我想为我的网站生成图形站点地图据我所知有两个阶段抓取网站并分析链接关系提取树形结构生成视觉上
如何在python中确定过去的时区特定日期是否是夏令时？

有没有办法检查特定时区在我指定的日期是否处于夏令时 test dt datetime year 2015 month 2 day 1 pst pytz timezone America Los Angeles test dt pst loc
Pandas 在列级别连接数据帧时添加键

根据 Pandas 0 19 2 文档我可以提供keys参数来创建结果多索引 DataFrame 一个例子来自 pandas 文档是 result pd concat frames keys x y z 我将如何连接数据框以便我可以在
在Python中清理属于不同语言的文本

我有一个文本集合其中的句子要么完全是英语印地语或马拉地语每个句子附加的 id 为 0 1 2 分别代表文本的语言无论任何语言的文本都可能有 HTML 标签标点符号等我可以使用下面的代码清理英语句子 import HTMLPars
在 Python 中使用类作为命名空间是个好主意吗

我正在将一堆相关的东西放入一个类中主要目的是将它们组织到命名空间中 class Direction north 0 east 1 south 2 west 3 staticmethod def turn right d return tu
监控培训课程如何运作？

我试图理解使用之间的区别tf Session and tf train MonitoredTrainingSession 以及我可能更喜欢其中之一似乎当我使用后者时我可以避免许多杂务例如初始化变量启动队列运行程序或设置文件编写器以
如何解决CDK CLI版本不匹配的问题

我收到以下错误此 CDK CLI 与您的应用程序使用的 CDK 库不兼容请将CLI升级到最新版本云程序集架构版本不匹配支持的最大架构版本为 8 0 0 但发现为 9 0 0 发出后cdk diff命令我确实跑了npm instal
如何在每次运行 python 程序时添加新列

我希望我的表的第一列作为卷号第二列作为名称每当我运行 python 程序时我想在表中添加一列日期在这个新列中我想填充从 user list 获得的列表将包含值 P A P P 等如何处理我尝试首先通过 alter 命令添加一列
在 Postman 中解析对另一个请求的 XML 响应

我必须测试一些以 XML 格式响应的 Web 服务并且我想解析从第一个请求到第二个请求调用的响应 Ex 我提出第一个请求
如何不断地将 STDOUT 发送到我的 python TCP 服务器？

我有简单的 python echo 服务器它使用套接字并向客户端回显随机数我有另一个程序每 2 秒将值打印到标准输出如果它只是一个脚本我可以像这样重定向 stdout python script py 并像这样在脚本中获取它da
telethon 库：如何通过电话号码添加用户

我正在研究 Telegram 的 Telethon 库它可以使用 Telegram API 充当 Telegram 客户端重要提示这是电报客户端 API https core telegram org telegram api 而不是
在 Qt 5 中嵌入 Python

我想将 Python 解释器嵌入到 Qt 5 应用程序中我在 Qt 5 中有一个工作应用程序但是当我把 include
如何使用 Python 实现并行 gzip 压缩？

使用python压缩大文件 https stackoverflow com questions 9518705 big file compression with python给出了一个很好的例子来说明如何使用例如bz2 纯粹用 Pytho
Django：显示管理员验证错误的自定义错误消息

我正在使用 Django 1 2 4 我有一个模型其中有一个需要验证的字段当验证失败时我想向用户显示自定义错误消息模型编辑是在管理界面中完成的这就是我目前正在做的事情 def clean fields self exclude N
给定一个字符串，如何删除所有重复的连续字母？

如何从字符串中删除两个连续的字母例如 a str hii thherre 应该成为 hi there 我尝试这样做 a str join sorted set a str key a str index 但是我得到 hi ter 是的
重写 PyGObject 中的虚拟方法

我正在尝试实施高宽几何管理 http developer gnome org gtk3 3 2 GtkWidget html geometry management在 GTK 和 Python 中用于我的自定义小部件我的小部件是来自的子类
如何通过 Selenium 内部的文本查找按钮（Python）？

我有以下三个按钮我不知道如何获取其中的文本例如异常值我试过browser find element by link text Outliers click 但出现无法找到元素错误我该怎么做 See find element by
gnuplot：第 1 行：无效命令

stackoverflow 上可爱的人们大家好我正在尝试使用 gnuplot 绘制数据我首先阅读表格并提取我想要的数据我将此数据写入 dat 文件截至目前我只是尝试通过命令行绘制它但会添加必要的代码以在 python 脚本工作后
如何从 python 中的字符串中删除 ANSI 转义序列

这是包含我的字符串的片段 ls r n x1b 00m x1b 01 31mexamplefile zip x1b 00m r n x1b 01 31m 该字符串是从我执行的 SSH 命令返回的我无法使用当前状态下的字符串因为它包含 A
具有重复值的 Sqlite 列

就说专栏吧aSQLite 数据库的非常重复始终有相同的 4 个值其他值可能稍后出现但不同值的数量将少于 1000 个 VALUES hello world it s a shame to store this str many tim

随机推荐

如何使用 symPy 和 numPy 用符号替换矩阵

我试图用方程中的两个符号代替它们各自的矩阵形式我创建了一个换向器函数它形成了我的表达式 t vS sy symbols t vS commutative False hS t vS eta myComm t hS dHs myComm
转换为 ScheduledThreadPoolExecutor

我还是Java的初学者所以我对线程和并发还没有了解太多但是我希望能够使用 ScheduledThreadPoolExecutor 作为计时器因为我在使用 java util Timer 和 TimerTask 时遇到问题我对线程的
Eclipse 拼写引擎不存在

我在 Windows 上使用 Eclipse 3 4 Ganymede 和 CDT 5 当集成的拼写检查器不知道某些单词时它会建议除其他外将该单词添加到用户词典中的选项如果用户词典尚不存在拼写检查器会提供帮助配置它并显示常规编
Android导航抽屉（调用活动）与抽象MainActivity

我想要一个 AbstractMainActivity 来创建导航抽屉在那里我还应该处理菜单项的点击然后调用新的活动在这些活动中我想再次使用相同的导航抽屉我将使用 AbstractMainActivity 扩展子类并以与每个子类不
使用 CSS 创建光泽灯光效果

I m trying to create a light effect with CSS and HTML only Just like this image 我不知道是否可能或者如何做任何帮助将不胜感激 circle border 1
OOP 设计：如何将数据库处理合并到应用程序对象中

这是我经常遇到的一个设计问题我想找到一些关于这个主题的一般见解此处提供的代码只是一个示例在设计阶段很容易决定您需要一个对象 User Unique ID Login name Password Full name 并且很容易将其转换为
在WebKit中，如何获取资源的内容？

我一直在编写一个 Mac 应用程序来检查每个 HTTP 请求因此我使用 WebView 来加载请求问题是我似乎无法弄清楚如何获取每个资源项的内容我正在尝试通过以下方式获取资源的内容WebResourceLoadDelegate met
System.loadLibrary() 错误

我成功地使用 android ndk Standalone 工具链交叉编译了一个 C 库然后我在 Eclipse 中创建了一个新的 Android 应用程序项目当我将 mylib so 放入 jni 文件夹并执行 ndk build
如何在 Docker 中将卷从容器挂载到主机？

我有一个关于 Docker 中整个数据卷过程的问题基本上这里有两个 Dockerfile 及其各自的运行命令 Dockerfile 1 Transmission over Debian Version 2 92 FROM debian t
R：从 GLMNet 获取 AIC/BIC/Likelihood

我想知道是否可以从 GLMNet 获取 AIC 和 BIC 我发现 glmnet cr 似乎能够做到这一点但我的回应是时间而不是序数我可以根据可能性自己计算它但 glmnet 也不会返回 Tangential 我真的可以返回 l1n
使用撰写文本进行链接

我找不到如何链接我的Text 使用 Jetpack Compose 在撰写之前我要做的就是 Linkify addLinks myTextView Linkify EMAIL ADDRESSES or Linkify WEB URLS 显然
Flask-SQLAlchemy 中连接后的过滤

我有两张桌子 location and country 正在尝试查询在我的烧瓶应用程序中由以下模型表示 from sqlalchemy import Column DateTime ForeignKey Integer Numeric S
将 URL 中的 HTTP 参数与 Android Intent Filter 相匹配

我正在尝试组合一个意图过滤器以便在浏览器中访问某个 HTML URL 时启动我的应用程序当它是标准网址例如 www stonyx com 时我这样做没有任何问题但是我需要将 URL 与 HTTP 参数如 www stonyx
使用 Visual studio 2013 Professional 的 Windows Phone 8 应用程序 [重复]

这个问题在这里已经有答案了在将 Visual studio 2010 升级到 2012 2013 的混乱中 2013 年是创建 Windows 商店应用程序的唯一选择但没有给出对 Windows Phone 应用程序开发的支持的清晰图片
在java中将二维二进制矩阵转换为黑白图像

我是java新手我现在有只有 1 和 0 的 2D 二进制矩阵我想将其保存为具有相同宽度和高度的jpg图像黑白我怎么能意识到这一点呢我尝试了下面的代码但失败了说 java lang IllegalArgumentExceptio
如何建立 .NET 开发树？ [关闭]

Closed 这个问题是基于意见的目前不接受答案如何建立 NET 开发树我使用这样的结构 projectname config where I put the configuration files doc where I put a
当我输入“cd ~”时，“~”是什么目录？

我刚开始使用 SSH 但是当我登录时我最终会进入目录通常与 FTP 进入时的目录相同我仍然可以转到但我不知道是什么意思家它与的关系在哪里或者我怎样才能找到是当前登录用户主目录的别名要找出它到底在哪里请输入pwd 代表
两个文件包含 main() Visual Studio 的定义？

我在 Visual Studio 2008 专业版中创建了一个项目该项目为每个作业包含一个 cpp 文件如下所示 Source Files 233 cpp test cpp 每个文件都包含 main 的定义操作 CTRL F5 Err
更新视图控制器之间的状态栏样式

In my info plist 我有的文件View controller based status bar appearance set to YES 我有一个FirstViewController状态栏隐藏的地方 In my Secon
如何从 lxml 获取原始 XML？

我使用以下代码来定位 div parser etree HTMLParser tree etree parse StringIO page parser div tree xpath div class content 0 我唯一的问题是

如何从 lxml 获取原始 XML？

如何从 lxml 获取原始 XML？ 的相关文章

随机推荐

热门标签

如何从 lxml 获取原始 XML？的相关文章