lxml.etree、element.text 不返回元素的整个文本

2023-12-25

我通过 xpath 废弃了一些 html,然后将其转换为 etree。与此类似的东西:

<td> text1 <a> link </a> text2 </td>

但是当我调用 element.text 时,我只得到 text1 (它必须在那里,当我在 FireBug 中检查查询时,元素的文本被突出显示,嵌入锚元素之前和之后的文本......


Use element.xpath("string()") or lxml.etree.tostring(element, method="text") - see 文档 http://lxml.de/tutorial.html#elements-contain-text.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

lxml.etree、element.text 不返回元素的整个文本 的相关文章

随机推荐

  • Excel/VBA - 如何在字符串中每 N 个字符插入一个字符

    我有一份报告 导出时它在单个单元格中将订单号 始终为 7 位长 显示为单个字符串 例如 订单 1234567 和 9876543 将在单个单元格中显示为 12345679876543 每个单元格没有最大订单数 每个单元格的最大订单数都不同
  • 如何以编程方式更改 Mac OS X 中的背景?

    我将如何以编程方式更改 Mac OS X 中的桌面背景 我想使用 python 但我对任何可能的方式都感兴趣 我可以连接到终端并调用某个命令吗 来自 python 如果你有应用脚本 http appscript sourceforge ne
  • 如何将 URL 数组中的图像列表添加到文档中?

    假设我有一个充满图像源 URL 的数组 例如 var imgs http lorempizza com 380 240 http dummyimage com 250 ffffff 000000 http lorempixel com g
  • 将记录添加到 has_and_belongs_to_many 关系

    我有两个模型 用户和促销 这个想法是 一个促销可以有很多用户 一个用户可以有很多促销 class User lt ActiveRecord Base has and belongs to many promotions end class
  • Intellij 14 + lombok:@Slf4j 找不到符号日志

    Intellij 无法识别 SLF4J 注释 我有以下错误 Error 105 9 java cannot find symbol symbol variable log location class com xxxxx SdsConfig
  • 从groovy脚本加载脚本

    文件1 groovy def method println test 文件2 groovy method 我想在运行时加载 包含 File1 groovy 中的函数 方法 相当于 ruby s rake 的加载 它们位于两个不同的目录中 如
  • 如何在 Google Colab 中拆分代码单元?

    使用Jupyter Notebook我发现分割单元格的功能非常有用 我也想在 Google Colab 中执行此操作 但我找不到如何执行此操作 能做到吗 如果答案是肯定的 怎么办 我不知道如何通过菜单选择来完成此操作 但在 Jupyter
  • 使用 NetNamedPipe 的 WCF 多个应用程序

    我正在尝试在同一台计算机上运行多个 WCF 服务托管应用程序 我想运行多个应用领域 不在一个应用程序中提供多项服务 var host new ServiceHost typeof MyClass1 new Uri new Uri net p
  • redis-py 退出时不关闭线程

    我正在使用 redis py 2 10 6 和 redis 4 0 11 我的应用程序使用 redis 作为数据库和 pubsub 当我关闭时 我经常会遇到挂起或崩溃的情况 后者通常会抱怨处理 pubsub 回调时发生的错误文件描述符或文件
  • Access 中的多个 LEFT JOIN

    我有以下查询 适用于 MySQL DELETE test1 test2 test3 test4 FROM test1 LEFT JOIN test2 ON test2 qid test1 id LEFT JOIN test3 ON test
  • PHP中如何检查IP地址是否在两个IP范围内?

    我有一个 IP 地址 并且还获得了另外两个 IP 地址 它们一起创建了一个 IP 范围 我想检查第一个IP地址是否在这个范围内 我怎样才能在 PHP 中找到它 With ip2long http php net manual en func
  • 自定义单选ListView

    我想制作一个自定义列表视图 在一行中具有两个 TextView 和一个单选按钮 在列表项上单击单选按钮状态应为切换 我不能在这里使用简单适配器 我已经问过这个问题了单选ListView自定义Row Layout https stackove
  • Android 工具栏仅在 AppBarLayout 折叠时显示标题和副标题

    我有 AppBarLayout CollapsingToolbarLayout 和工具栏的活动 从代码中设置标题和副标题 最初我希望工具栏隐藏并在应用栏布局折叠时显示 使用我的代码 它可以工作 工具栏最初隐藏 但它始终显示工具栏标题和副标题
  • 合并 MongoDB 聚合中的数组字段

    使用 MongoDB 聚合框架时是否可以合并数组字段 这是我试图解决的一个摘要问题 用于聚合的示例输入文档 Category 1 Messages Msg1 Msg2 Value 1 Category 1 Messages Value 10
  • 使用 UNC 路径的 Windows 8 StorageFile.GetFileFromPathAsync

    有没有人曾经设法使用 Windows 8 应用程序将文件从 unc 目录复制到本地目录 根据这里的官方文档 http msdn microsoft com en us library windows apps hh967755 aspx 可
  • 如何在 C# 中解密由 PHP 中的 mcrypt 加密的加密 MCRYPT_RIJNDAEL_256 值?

    我正在尝试从 Linux 端管理的数据库表中读取 Base64 编码的值 在那里面 表中有一个名为first name 的列 在 Linux 端 我可以通过在 PHP 中使用以下命令轻松解密 data mcrypt decrypt MCRY
  • C++11 - 编译时多态解决方案

    假设我正在编写一个跨平台库 我必须以不同平台有不同行为的方式组织代码 并且这种行为 或定义 是在编译时根据我的库所在的平台选择的正在编译中 在 C 中执行此操作的 通常 方法是用大量的内容污染代码 ifdef当编写方法或类时 方法的问题在于
  • UTF16 十六进制转文本

    我有 UTF 16 十六进制表示形式 例如 0633064406270645 它是阿拉伯语中的 S 我想将其转换为其等效文本 在 PostgreSQL 中有直接的方法可以做到这一点吗 我可以像下面这样转换 UTF 代码点 不幸的是 似乎不支
  • F# 类型提供程序构建非常非常慢

    我正在使用类型提供程序 特别是 sql 实体框架类型提供程序 我正在针对一个包含大量对象的数据库编写测试 并且它是远程的 因此连接有点慢 每次我构建项目都会花费很多时间 需要几分钟才能完成构建 我缺少什么为什么编译器不缓存类型信息 附 使用
  • lxml.etree、element.text 不返回元素的整个文本

    我通过 xpath 废弃了一些 html 然后将其转换为 etree 与此类似的东西 td text1 a link a text2 td 但是当我调用 element text 时 我只得到 text1 它必须在那里 当我在 FireBu