如何从 lxml 获取原始 XML?

2023-11-27

我使用以下代码来定位 div:

parser = etree.HTMLParser()
tree = etree.parse(StringIO(page), parser)

div = tree.xpath("//div[@class='content']")[0]

我唯一的问题是,执行此操作后,我不想依赖 lxml 来提取所述 div 的内容:我只想取回 div 包含的原始 XML。这是可行的还是我必须完全放弃这种方法?


我想您正在寻找:

etree.tostring(div)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何从 lxml 获取原始 XML? 的相关文章

  • 如何生成大型网站的图形站点地图[关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我想为我的网站生成图形站点地图 据我所知 有两个阶段 抓取网站并分析链接关系 提取树形结构 生成视觉上
  • 如何在python中确定过去的时区特定日期是否是夏令时?

    有没有办法检查特定时区在我指定的日期是否处于夏令时 test dt datetime year 2015 month 2 day 1 pst pytz timezone America Los Angeles test dt pst loc
  • Pandas 在列级别连接数据帧时添加键

    根据 Pandas 0 19 2 文档 我可以提供keys参数来创建结果多索引 DataFrame 一个例子 来自 pandas 文档 是 result pd concat frames keys x y z 我将如何连接数据框以便我可以在
  • 在Python中清理属于不同语言的文本

    我有一个文本集合 其中的句子要么完全是英语 印地语或马拉地语 每个句子附加的 id 为 0 1 2 分别代表文本的语言 无论任何语言的文本都可能有 HTML 标签 标点符号等 我可以使用下面的代码清理英语句子 import HTMLPars
  • 在 Python 中使用类作为命名空间是个好主意吗

    我正在将一堆相关的东西放入一个类中 主要目的是将它们组织到命名空间中 class Direction north 0 east 1 south 2 west 3 staticmethod def turn right d return tu
  • 监控培训课程如何运作?

    我试图理解使用之间的区别tf Session and tf train MonitoredTrainingSession 以及我可能更喜欢其中之一 似乎当我使用后者时 我可以避免许多 杂务 例如初始化变量 启动队列运行程序或设置文件编写器以
  • 如何解决CDK CLI版本不匹配的问题

    我收到以下错误 此 CDK CLI 与您的应用程序使用的 CDK 库不兼容 请将CLI升级到最新版本 云程序集架构版本不匹配 支持的最大架构版本为 8 0 0 但发现为 9 0 0 发出后cdk diff命令 我确实跑了npm instal
  • 如何在每次运行 python 程序时添加新列

    我希望我的表的第一列作为卷号 第二列作为名称 每当我运行 python 程序时 我想在表中添加一列日期 在这个新列中 我想填充从 user list 获得的列表将包含值 P A P P 等 如何处理 我尝试首先通过 alter 命令添加一列
  • 在 Postman 中解析对另一个请求的 XML 响应

    我必须测试一些以 XML 格式响应的 Web 服务 并且我想解析从第一个请求到第二个请求调用的响应 Ex 我提出第一个请求
  • 如何不断地将 STDOUT 发送到我的 python TCP 服务器?

    我有简单的 python echo 服务器 它使用套接字 并向客户端回显随机数 我有另一个程序 每 2 秒将值打印到标准输出 如果它只是一个脚本 我可以像这样重定向 stdout python script py 并像这样在脚本中获取它da
  • telethon 库:如何通过电话号码添加用户

    我正在研究 Telegram 的 Telethon 库 它可以使用 Telegram API 充当 Telegram 客户端 重要提示 这是电报客户端 API https core telegram org telegram api 而不是
  • 在 Qt 5 中嵌入 Python

    我想将 Python 解释器嵌入到 Qt 5 应用程序中 我在 Qt 5 中有一个工作应用程序 但是当我把 include
  • 如何使用 Python 实现并行 gzip 压缩?

    使用python压缩大文件 https stackoverflow com questions 9518705 big file compression with python给出了一个很好的例子来说明如何使用例如bz2 纯粹用 Pytho
  • Django:显示管理员验证错误的自定义错误消息

    我正在使用 Django 1 2 4 我有一个模型 其中有一个需要验证的字段 当验证失败时 我想向用户显示自定义错误消息 模型编辑是在管理界面中完成的 这就是我目前正在做的事情 def clean fields self exclude N
  • 给定一个字符串,如何删除所有重复的连续字母?

    如何从字符串中删除两个连续的字母 例如 a str hii thherre 应该成为 hi there 我尝试这样做 a str join sorted set a str key a str index 但是 我得到 hi ter 是的
  • 重写 PyGObject 中的虚拟方法

    我正在尝试实施高宽几何管理 http developer gnome org gtk3 3 2 GtkWidget html geometry management在 GTK 和 Python 中用于我的自定义小部件 我的小部件是来自的子类
  • 如何通过 Selenium 内部的文本查找按钮(Python)?

    我有以下三个按钮 我不知道如何获取其中的文本 例如异常值 我试过browser find element by link text Outliers click 但出现 无法找到元素 错误 我该怎么做 See find element by
  • gnuplot:第 1 行:无效命令

    stackoverflow 上可爱的人们大家好 我正在尝试使用 gnuplot 绘制数据 我首先阅读表格并提取我想要的数据 我将此数据写入 dat 文件 截至目前 我只是尝试通过命令行绘制它 但会添加必要的代码以在 python 脚本工作后
  • 如何从 python 中的字符串中删除 ANSI 转义序列

    这是包含我的字符串的片段 ls r n x1b 00m x1b 01 31mexamplefile zip x1b 00m r n x1b 01 31m 该字符串是从我执行的 SSH 命令返回的 我无法使用当前状态下的字符串 因为它包含 A
  • 具有重复值的 Sqlite 列

    就说专栏吧aSQLite 数据库的非常重复 始终有相同的 4 个值 其他值可能稍后出现 但不同值的数量将少于 1000 个 VALUES hello world it s a shame to store this str many tim

随机推荐

  • 如何使用 symPy 和 numPy 用符号替换矩阵

    我试图用方程中的两个符号代替它们各自的矩阵形式 我创建了一个换向器函数 它形成了我的表达式 t vS sy symbols t vS commutative False hS t vS eta myComm t hS dHs myComm
  • 转换为 ScheduledThreadPoolExecutor

    我还是Java的初学者 所以我对线程和并发还没有了解太多 但是 我希望能够使用 ScheduledThreadPoolExecutor 作为计时器 因为我在使用 java util Timer 和 TimerTask 时遇到问题 我对线程的
  • Eclipse 拼写引擎不存在

    我在 Windows 上使用 Eclipse 3 4 Ganymede 和 CDT 5 当集成的拼写检查器不知道某些单词时 它会建议 除其他外 将该单词添加到用户词典中的选项 如果用户词典尚不存在 拼写检查器会提供帮助配置它并显示 常规 编
  • Android导航抽屉(调用活动)与抽象MainActivity

    我想要一个 AbstractMainActivity 来创建导航抽屉 在那里我还应该处理菜单项的点击 然后调用新的活动 在这些活动中 我想再次使用相同的导航抽屉 我将使用 AbstractMainActivity 扩展子类 并以与每个子类不
  • 使用 CSS 创建光泽灯光效果

    I m trying to create a light effect with CSS and HTML only Just like this image 我不知道是否可能 或者如何做 任何帮助将不胜感激 circle border 1
  • OOP 设计:如何将数据库处理合并到应用程序对象中

    这是我经常遇到的一个设计问题 我想找到一些关于这个主题的一般见解 此处提供的代码只是一个示例 在设计阶段很容易决定您需要一个对象 User Unique ID Login name Password Full name 并且很容易将其转换为
  • 在WebKit中,如何获取资源的内容?

    我一直在编写一个 Mac 应用程序来检查每个 HTTP 请求 因此我使用 WebView 来加载请求 问题是我似乎无法弄清楚如何获取每个资源项的内容 我正在尝试通过以下方式获取资源的内容WebResourceLoadDelegate met
  • System.loadLibrary() 错误

    我成功地使用 android ndk Standalone 工具链交叉编译了一个 C 库 然后 我在 Eclipse 中创建了一个新的 Android 应用程序项目 当我将 mylib so 放入 jni 文件夹并执行 ndk build
  • 如何在 Docker 中将卷从容器挂载到主机?

    我有一个关于 Docker 中整个数据卷过程的问题 基本上这里有两个 Dockerfile 及其各自的运行命令 Dockerfile 1 Transmission over Debian Version 2 92 FROM debian t
  • R:从 GLMNet 获取 AIC/BIC/Likelihood

    我想知道是否可以从 GLMNet 获取 AIC 和 BIC 我发现 glmnet cr 似乎能够做到这一点 但我的回应是时间 而不是序数 我可以根据可能性自己计算它 但 glmnet 也不会返回 Tangential 我真的可以返回 l1n
  • 使用撰写文本进行链接

    我找不到如何链接我的Text 使用 Jetpack Compose 在撰写之前我要做的就是 Linkify addLinks myTextView Linkify EMAIL ADDRESSES or Linkify WEB URLS 显然
  • Flask-SQLAlchemy 中连接后的过滤

    我有两张桌子 location and country 正在尝试查询 在我的烧瓶应用程序中由以下模型表示 from sqlalchemy import Column DateTime ForeignKey Integer Numeric S
  • 将 URL 中的 HTTP 参数与 Android Intent Filter 相匹配

    我正在尝试组合一个意图过滤器 以便在浏览器中访问某个 HTML URL 时启动我的应用程序 当它是标准网址 例如 www stonyx com 时 我这样做没有任何问题 但是 我需要将 URL 与 HTTP 参数 如 www stonyx
  • 使用 Visual studio 2013 Professional 的 Windows Phone 8 应用程序 [重复]

    这个问题在这里已经有答案了 在将 Visual studio 2010 升级到 2012 2013 的混乱中 2013 年是创建 Windows 商店应用程序的唯一选择 但没有给出对 Windows Phone 应用程序开发的支持的清晰图片
  • 在java中将二维二进制矩阵转换为黑白图像

    我是java新手 我现在有只有 1 和 0 的 2D 二进制矩阵 我想将其保存为具有相同宽度和高度的jpg图像 黑白 我怎么能意识到这一点呢 我尝试了下面的代码但失败了 说 java lang IllegalArgumentExceptio
  • 如何建立 .NET 开发树? [关闭]

    Closed 这个问题是基于意见的 目前不接受答案 如何建立 NET 开发树 我使用这样的结构 projectname config where I put the configuration files doc where I put a
  • 当我输入“cd ~”时,“~”是什么目录?

    我刚开始使用 SSH 但是当我登录时 我最终会进入目录 通常与 FTP 进入时的目录相同 我仍然可以转到 但我不知道 是什么意思 家 它与 的关系在哪里 或者我怎样才能找到 是当前登录用户主目录的别名 要找出它到底在哪里 请输入pwd 代表
  • 两个文件包含 main() Visual Studio 的定义?

    我在 Visual Studio 2008 专业版中创建了一个项目 该项目为每个作业包含一个 cpp 文件 如下所示 Source Files 233 cpp test cpp 每个文件都包含 main 的定义 操作 CTRL F5 Err
  • 更新视图控制器之间的状态栏样式

    In my info plist 我有的文件View controller based status bar appearance set to YES 我有一个FirstViewController状态栏隐藏的地方 In my Secon
  • 如何从 lxml 获取原始 XML?

    我使用以下代码来定位 div parser etree HTMLParser tree etree parse StringIO page parser div tree xpath div class content 0 我唯一的问题是