xuexila作文 lxml etree xpath如何同时选择多种标签tag

2023-11-19

以学习啦为例，说明如何选择一个大范围标签下面的两个及以上种类标签tag。
例如
div
p 1 /p
h2 2 /h2
p 3 /p
/div
只有同时可以选择p, h2，内容1,2,3的顺序才不会乱。

from lxml import etree
import requests
from requests.exceptions import HTTPError
import re
import os


def get_xuexila(url):
    try:
        res = requests.get(url)
        res.raise_for_status()
        res.encoding = 'UTF-8'
        tree = etree.HTML(res.text)
        ps = tree.xpath('//*[@id="contentText"]/p|//*[@id="contentText"]/h2')
        for onep in ps:
            print(onep.text)
    except HTTPError:
        print("HTTP Error!")


if __name__ == '__main__':
    url = input('输入学习啦url')
    get_xuexila(url)
    print('Done')

这里，关键点在于 whole path a | whole path b，而不是最后的p|h2，后面xpath 2.0或者可以支持。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

开发语言

xuexila作文 lxml etree xpath如何同时选择多种标签tag 的相关文章

我应该如何在 python 中使用 lxml 处理 XLink 引用？

我被要求编写一些读取 XML 配置文件的脚本这些文件充分利用 XLink 来包含存储在多个文件中的 XML 例如
在 Python 3.6 中，为什么负数的分数次方在 numpy 数组中返回 nan？

我最近开始学习Python 并且经历了NumPy 官方快速入门指南 https docs scipy org doc numpy dev user quickstart html indexing slicing and iterating
Python动态导入脚本，需要有其__name__ == "__main__"代码才能被调用

当从另一个脚本导入 python 脚本时我想要受经典保护的脚本代码 if name main 要运行我怎样才能运行该代码我想做的是从 python 脚本动态更改模块然后导入现有脚本该脚本应该看到所做的更改并运行其 main 像Py
出现导入错误：无法从“随机”导入名称“随机”[重复]

这个问题在这里已经有答案了我在我的计算机上多次运行我的代码但没有出现此错误但突然间这个来了 File e Python 3 8 0 lib site packages comtypes client code cache py lin
Python 按文件夹模块导入

我有一个目录结构 example py templates init py a py b py a py and b py只有一个类名称与文件相同因为它们是猎豹模板纯粹出于风格原因我希望能够在中导入和使用这些类example py像
肥皂服务的良好框架是什么？

我正在寻找一个用于肥皂的好框架service 我更喜欢使用Pythonic框架但是在查看了soaplib rpclib 太不稳定 SOAPy 不适用于2 7 和ZSI 太令人困惑之后我不确定这是否可能我对使用另一种语言感到满意尽
ValueError：在 R 中使用 keras 模型时在用户代码中

我正在尝试使用 R 在 R 中运行一维 CNNkeras包裹我正在使用以下代码 library MASS library keras Create some data data Boston data lt Boston create a
numpy 数组最快的保存和加载选项

我有一个生成二维的脚本numpy数组与dtype float和形状的顺序 1e3 1e6 现在我正在使用np save and np load对数组执行 IO 操作然而这些函数对于每个数组都需要几秒钟的时间是否有更快的方法来保存和加载
使用子图绘制 pandas 数据框 (subplots=True)：放置图例并使用紧凑的布局

我真的很喜欢 pandas 来处理和分析大数据集到目前为止我主要使用 matplotlib 进行绘图但现在想使用 pandas 自己的绘图功能基于 matplotlib 因为它需要更少的代码并且在大多数情况下对我来说似乎足够了尤
字母表中的加密和解密 - Python GCSE

我目前正在尝试为学校编写一个程序以便加密和解密输入的消息我需要加密或解密的消息仅在字母表中没有其他符号或密钥例如使用消息车加密输入的偏移量为 5 我希望它输出 afs 有人可以帮忙吗这是我目前的代码 def find offse
Cython：为什么 size_t 比 int 快？

更改某些 Cython 变量的类型int输入size t可以显着减少某些功能的时间 30 但我不明白为什么例如 cimport numpy as cnp import numpy as np def sum int cnp int64 t
为什么全新安装后会有pip和conda包？

All Windows 10 64 位 d l Anaconda 2 5 0 与 Python3 64 位并安装全新安装后我输入conda list 并且在软件包中我看到重复像 jupyter 1 0 0 py35 1 jupyte
如何将时间间隔划分为不同长度的部分？

我有一个从 0 到t 我想把这个区间分成一个以2 25 2 25 1 5为周期的累积序列方法如下 input start 0 stop 19 output sequence 0 2 25 4 5 6 8 25 10 5 12 14 25
监控单个文件

我需要监控使用watchdog http pythonhosted org watchdog index html 单个文件而不是整个目录避免监视整个目录的最佳方法是什么我想this http pythonhosted org wa
在Python中引用不带换行符的长字符串

我正在尝试在 Python 中编写一个长字符串该字符串显示为 OptParser 选项的帮助项在我的源代码 py 文件中我想放置换行符以便我的代码不会花费新行但是我不希望这些换行符影响代码运行时该字符串的显示方式例如我想写
Python 类方法的示例用例是什么？

我读了Python 中的类方法有什么用 https stackoverflow com questions 38238 what are class methods in python for但那篇文章中的例子很复杂我正在寻找 Pytho
如何从python导入路径中删除当前目录

我想使用 Mercurial 存储库hg本身也就是说我克隆了 Mercurialhttps www mercurial scm org repo hg https www mercurial scm org repo hg并想运行一些h
在 python 中使用递归替代 len()

作为 CS1301 问题的一部分我正在尝试使用递归编写一个函数该函数将执行与 len 完全相同的操作但是我有两个问题我正在使用全局变量但我在课程中还没有学到这一点 cs1301 自动评分器告诉我我的函数返回 26 而不是 13
Python请求401错误但url在浏览器中打开

我正在尝试从这个位置提取 json https www nseindia com api option chain indices symbol BANKNIFTY https www nseindia com api option cha
将 pandas 数据框中的多列更改为日期时间

我有一个 13 列和 55 000 行的数据框我正在尝试将其中 5 行转换为日期时间现在它们返回类型对象我需要转换这些数据以进行机器学习我知道如果我这样做 data birth date pd to datetime data b

随机推荐

浅谈HTTP中Get、Post、Put与Delete请求方式的区别

1 GET请求会向数据库发索取数据的请求从而来获取信息该请求就像数据库的select操作一样只是用来查询一下数据不会修改增加数据不会影响资源的内容即该请求不会产生副作用无论进行多少次操作结果都是一样的 2 与GET不同的是
房价预测回归模型--tensorflow2.0学习笔记--tf.keras使用实例

import tensorflow as tf import matplotlib as mpl import matplotlib pyplot as plt matplotlib inline import numpy as np im
Netty框架之概述及基本组件介绍

概述 Netty是由JBOSS提供的一个java开源框架是一个高性能高可扩展性的异步事件驱动的网络应用程序框架它极大地简化了TCP和UDP客户端和服务器开发等网络编程 NIO有下面的缺点 JDK 的 NIO 底层由 epoll
计算机文件及文件夹管理软件,常用管家(电脑文件夹管理工具)V1.1 免费版

常用管家电脑文件夹管理工具是一款很优秀好用的文件夹管理助手如果你需要一款好用的文件夹管理工具不妨试试小编带来的这款常用管家软件功能强大全面使用后可以帮助用户更轻松便捷的管理文件夹软件能够快速收藏和打开常用的文件夹网站并且能
决策树实战：california房价预测

Python3 7 决策树实战 california房价预测网上有好多2 版本的代码但是本地安装的是python3 7版本在学习中遇到很多问题有很多地方和2 版本的不一样所以记录下来方便参考侵权必删导入模块 import pa
CISCN2018-WP

MISC 验证码用token登录输入好验证码就可以得到flag Picture 图片隐写一下就想到binwalk或者winhex打开试试 binwalk打开无果将这段数据ctrl shift c复制出来用下面python脚本生成z
HTML标签及浮动
7.块设备驱动的I/O请求处理(2)

不适用请求队列使用请求队列对于一个机械磁盘设备而言的确有助于提高系统的性能但是对于RAMDISK ZRAM Compressed RAM Block Device 等完全可真正随机访问的设备而言无法从高级的请求队列逻辑中获益对于这些
稳定性相关大纲

稳定性建设的几个维度个人渣记录仅为自己搜索用的博客 CSDN博客道法术器稳定性相关代码产品灰度能力降级百分比能力动态diamond doom测试单元测试稳定性改造高资源占用优化方法架构上改造降流量例如心跳内部逻辑
真正的阅读者，是不需要荐书的

From http www luanxiang org blog archives 2136 html 早上一个朋友在朋友圈里跟我说上次你推荐的信息简史和知识的边界两本书我觉得很不错这条消息让我比较差异首先我并没有推荐过
数据集分割

步骤 1 确定训练集和测试集是否同分布常用方法 1 留出法实现直接将数据集拆分为互斥的训练集验证集和测试集划分比例训练集验证集测试集 7 1 5 1 5 注意事项单次使用留出法会导致模型不稳定保证三种数据集中样本比例的相
Linux 下使用 C++ 实现的 Web 文件服务器

项目地址 Github https github com shangguanyongshi WebFileServer 在学习完成 TCP IP 网络编程和 Linux高性能服务器编程后阅读了一些Web服务器的相关代码自动动手使用
code style

最近一直在看java convention和google c style 因为老板要提高代码质量我们小公司一个因为客户说我们的代码质量太烂了于是开始搞代码质量先从静态代码质量开始于是就研究起来code style 但是我发现
Pthread 并发编程（三）——深入理解线程取消机制

基本介绍线程取消机制是 pthread 给我们提供的一种用于取消线程执行的一种机制这种机制是在线程内部实现的仅仅能够在共享内存的多线程程序当中使用基本使用 include
【ARM】程序快速定位segmentation fault core dumped错误

1 应用场景 ARM开发过程中经常进程运行着出现段错误这时候单纯靠加日志打log效率太低使用gdb的话由于APP进程太多生成的core的文件特别大而且gdb在arm板子也不好单步调试不太友好还是pass掉目前使用段错误捕捉SI
Python3爬虫——用Xpath提取网页信息

Python3爬虫用Xpath提取网页信息前言本笔记用于记录整理requests库的一些基本知识内容会根据博主自己的认知作增添或压缩水平有限如有错误请不吝赐教本文需要读者初步了解HTML有关节点的相关知识文章目录 Pytho
Python技能练习！值得你看的28道常见题型汇总！（附答案解析）

今天给大家分享30道Python练习题建议大家先独立思考一下解题思路再查看答案文末有惊喜 1 已知一个字符串为 hello world yoyo 如何得到一个队列 hello world yoyo 使用 split 函数分割字符串
C#多线程Lock锁定的使用例子(多线程线程同步）

这个例子是一个模拟多个人在多台提款机上同时提取一个账户的款的情况在存取的过程中可能 A线程取了100 而B线程那边还看见账户上没少掉那100快所以导致数据不统一赋值出现问题下面代码则可以测试出加上Lock锁定与不加的区别先上
学会这几个简单的bat代码，轻松在朋友面前装一波13

这个标题是干什么用的最近看晚上某些人耍cmd耍的十分开心还自称为黑客着实比较搞笑他们那些花里胡哨的东西在外行看来十分nb 但只要略懂一些就会发现他们的那些十分搞笑和滑稽今天这里分享几个类似的方法让你在不懂行的朋友面前秀一波
xuexila作文 lxml etree xpath如何同时选择多种标签tag

以学习啦为例说明如何选择一个大范围标签下面的两个及以上种类标签tag 例如 div p 1 p h2 2 h2 p 3 p div 只有同时可以选择p h2 内容1 2 3的顺序才不会乱 from lxml import etree im

xuexila作文 lxml etree xpath如何同时选择多种标签tag

xuexila作文 lxml etree xpath如何同时选择多种标签tag 的相关文章

随机推荐

热门标签