如何用Python提取网页的某些部分

2024-07-04

目标网页：http://www.immi.gov.au/skilled/general-skilled-migration/estimated-allocation-times.htm http://www.immi.gov.au/skilled/general-skilled-migration/estimated-allocation-times.htm

我要提取的部分：

  <tr>
  <td>Skilled &ndash; Independent (Residence) subclass 885<br />online</td>
  <td>N/A</td>
  <td>N/A</td>
  <td>N/A</td>
  <td>15 May 2011</td>
  <td>N/A</td>
  </tr>

一旦代码通过搜索关键字“找到此部分”885子类
online”，然后应该打印第五个标签内的日期，即“2011 年 5 月 15 日”如上图所示。

它只是我自己的一个监视器，用来关注我的移民申请的进展情况。

"美女——呜呜——哎呀！ http://www.crummy.com/software/BeautifulSoup/

美女——呜呜——哎呀！ http://www.crummy.com/software/BeautifulSoup/

晚上的 Soo-oop，

美丽，美丽的汤！ http://www.crummy.com/software/BeautifulSoup/"

——刘易斯·卡罗尔，爱丽丝梦游仙境 http://www.cs.cmu.edu/%7Ergs/alice-X.html

我想这正是他的初衷吧！

假海龟可能会做这样的事情：

>>> from BeautifulSoup import BeautifulSoup
>>> import urllib2
>>> url = 'http://www.immi.gov.au/skilled/general-skilled-migration/estimated-allocation-times.htm'
>>> page = urllib2.urlopen(url)
>>> soup = BeautifulSoup(page)
>>> for row in soup.html.body.findAll('tr'):
...     data = row.findAll('td')
...     if data and 'subclass 885online' in data[0].text:
...         print data[4].text
... 
15 May 2011

但我不确定这会有帮助，因为那个日期已经过去了！

祝申请顺利！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

html

string

如何用Python提取网页的某些部分的相关文章

如何扩展 C# 内置类型，例如 String？

我需要Trim a String 但我想删除字符串本身内所有重复的空格而不仅仅是在其末尾或开头我可以用这样的方法来做到这一点 public static string ConvertWhitespacesToSingleSpaces s
从子列表中切片元素 - Python

我想从中返回数字 5 list 1 1 2 3 4 5 6 我以为这会起作用但事实并非如此 print list 1 1 1 它返回一个空列表它是索引 1 第二个列表和位置 1 列表中的第二个数字这不应该起作用吗您需要两个单独的操
发送抓取请求以获取 torrent 的种子和同级

我一直在尝试创建一个 torrent 网站但我遇到了以下问题如何发送 torrent 抓取请求以获取其播种者和水蛭我有一个 PHP 类函数它为我提供公告列表 public function getTrackers Load trac
获取pygame中图像各个像素的颜色

如何获取传输到 pygame 表面的图像像素的颜色值使用 Surface get at 仅返回表面层的颜色而不返回其上位图传输的图像方法surface get at很好下面的示例显示了在没有 Alpha 通道的情况下位图传输图像时的
如何在引导程序使用jquery中单击另一个链接时更改活动类？

我有一个 html 作为侧边栏并使用Bootstrap ul class nav nav list li class active a href Link 1 a li li a href link2 Link 2 a li li a h
嵌入式Python，导入数学错误

首先我使用的是 Mac OSX 10 12 6 我想在我的 C 应用程序中嵌入 python 环境我把 github python 项目放在https github com python cpython https github com
传递导入错误：ModuleNotFoundError：没有名为“...”的模块

我现在很困惑这是项目树 project source lib init py utils py stats py test lib test stats py stats py has import utils 如果执行的话确实有效sta
添加 prefix_with 子句以插入特定类

我怎样才能定制prefix withSQLAlchemy 中的每个模型类以便每个模型类都可以有不同的插入语句我其实想要OR IGNORE子句添加到某些类中 PS 我对 SQLAlchemy 比较陌生 ORM 没有挂钩它的生成方式inse
HTML 文本和密码输入字段的大小不同 Internet Explorer

我正在为我的登录表单使用此表单设置 tr td class label Username td td td tr
Python 中的 HTML 解析器 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案使用Python文档我发现了HTML解析器 http docs python org lib modu
两个选择框重叠

我有两个选择框HTML 一个在另一个之下第一个选择框正常第二个选择框默认打开意味着无需单击即可显示选项现在当我点击第一个select box它的内容移动到另一个的后面select box HTML
Lightgbm OSError，库未加载

如果我简单地这样做 import lightgbm as lgb 我越来越 python script py Traceback most recent call last File script py line 4 in
ValueError：在 ECB 模式下数据必须与块边界对齐

我正在使用以下代码在 ECB 模式下尝试 aes 128 加密 from Crypto Cipher import AES key abcdefghijklmnop cipher AES new key encode utf8 AES MO
Numpy，沿数组维度应用函数列表

我有一个类型的函数列表 func list lambda x function1 input lambda x function2 input lambda x function3 input lambda x x 和形状为 4 200 2
剥离功能未按预期工作

def sstrip a b raw input enter the string to be stripped off i a strip b print i k raw input enter the string sstrip k o
将 LIVE SPEECH 与 Tkinter GUI 连接

我想将 pocketsphinx livespeech 与 Python tkinter GUI 连接起来这样 GUI 在前端可见而 Livespeech 在后端工作但是当我将 tkinter 代码与 livespeech 代码合并时
无法让 python 请求与代理一起使用

我正在尝试通过代理服务器执行简单的获取请求 import requests test requests get http google com proxies http 112 5 254 30 80 print test text 代码中
过滤（减少）NumPy 数组

假设我有一个 NumPy 数组arr我想根据可广播函数的真值进行逐元素过滤减少例如我只想获取低于某个阈值的值k def cond x return x lt k 有几种方法例如使用发电机 np fromiter x for x
使用 setuptools 从私有 Gitlab 包存储库安装 Python 包

我为我的雇主创建了一个私人套餐由于我被禁止将其上传到 PyPI 它是专有的因此我将其上传到我们私人 Gitlab 中心上的项目的包索引中我可以手动安装它 pip install my package extra index url h
带图像背景的页面的 V 形部分

I m trying to make a one page website But I would like something to diversify it from all other similar sites I came up

随机推荐

如何模拟我正在测试的函数所使用的函数的默认参数？

我有这个my module py def sub function do the thing True if do the thing do stuff else do something else def main function do
如何将函数发送到远程 Pyro 对象

我正在尝试使用 Pyro 设置一些代码来处理远程主机上的 python 代码函数并获取结果启动名称服务器后我将在远程主机上执行此代码实际上仍在本地主机上 import Pyro4 class Server object def eva
将 WPF DLL 加载并运行到另一个 WPF exe 中

我的主要问题正如我在标题中所述 WPF APP1 gt 我在排除 App xaml 后创建了此 wpf 项目的 dllWPF APP2 gt 普通 WPF exe 需要运行上面的WPF APP1 dll并使用反射打开WPF APP1 Mai
通过 AJAX 调用的 PHP header() 无法正常工作

我是网络开发新手现在我正在开发网站上的登录功能我使用 Javascript AJAX 获取用户名和密码并将其发送到 PHP 文件以在 MYSQL 数据库上进行验证这就是我要做的我的问题是为什么 header 函数不能正常工作我想在
如何禁用 Mapbox 中的事件侦听器？

我正在尝试使用 React 上的 Mapbox 来控制图层上的事件侦听器 map off 应该可以做到这一点但它并没有删除图层中的 onclick 事件 https docs mapbox com mapbox gl js api map
将事件传递给父级

我想创建一个应用程序其中一些事件应该被处理就像它们被传递到父容器一样例如我有一个JPanel其中包含JLabel 顶端JPanel现在实现鼠标按下和拖动我需要做什么才能使事件看起来像他们到达的那样JPanel而不是标签本身更改源
在 iOS 模拟器上重复请求麦克风权限

我正在使用 Xcode 10 1 10B61 开发一个需要使用麦克风权限的应用程序几乎每次我从 Xcode 在模拟器中启动应用程序时我都会收到一个系统弹出窗口 Appname 想要访问麦克风隐私麦克风使用说明 gt 我选择不允
Cassandra 对具有不同分区键的表的批量查询性能

我有一个测试用例每秒从客户端收到 150k 请求我的测试用例需要插入UNLOGGED batch 多个表并具有不同的分区键 BEGIN UNLOGGED BATCH update kspace count table set count
将 INT_MAX 转换为浮点数，然后再转换回整数。

在 C 编程中我发现了一个奇怪的问题它违背了我的直觉当我声明一个integer as the INT MAX 2147483647 在limits h中定义并将其隐式转换为floatvalue 它工作正常即浮点值与最大整数相同然
从流中读取 Excel 文件

我需要一种从流中读取 Excel 文件的方法它似乎不适用于 ADO NET 的处理方式该场景是用户通过 FileUpload 上传文件我需要从文件中读取一些值并导入到数据库中由于几个原因我can t将文件保存到磁盘也没有理由这样做
如何使用远程机器人从服务器发送文件？

我制作了一个机器人它通过 URL 从外部服务器发送文件我希望机器人直接从您的服务器发送文件我究竟做错了什么为什么没有open 指挥工作 import telebot bot telebot TeleBot Token bot mes
创建 Jar 文件 - 在其他计算机上不起作用

我正在尝试将我的程序打包成 JAR 文件以便可以在多台计算机上使用我的程序由以下部分组成start java userinterface java and writer java 该程序是用 Eclipse 编写的在我的计算机上运行得
在 pandas DataFrame 中查找列值最大的行

如何找到特定列的值所在的行maximal df max 会给我每列的最大值我不知道如何获取相应的行使用熊猫idxmax https pandas pydata org pandas docs stable reference api p
并行处理 Azure blob 和批量复制到 SQL 数据库的设计帮助

我需要从 Azure 存储中获取 blob 文件读取它们获取数据并处理它然后将其存储到数据库中从 blob 获取的数据量很大即每个文件大约有 40K 条记录一个文件夹中有70个这样的文件我是这样设计的 I use Parall
在 NDB 中跟踪未知类型的反向引用

我正在 GAE 和 Python 2 7 运行时上编写我的第一个 RESTful Web 服务我已经开始使用 Guido 闪亮的新 ndb API 但是我不确定如何在没有原始数据库 API 的隐式反向引用功能的情况下解决特定情况如果用
将第三方 JS 和 CSS 库与我的项目资产打包在一起有好处吗？

我想开始使用缩小工具例如Minify http code google com p minify Uglify https github com mishoo UglifyJS or Closure https developers go
邮递员 Twilio Rest Api

您好我想知道是否有人可以帮助我我正在尝试使用 twilios 的 Rest api 但遇到了一些麻烦 MyAccountIdSid mySid和电话号码是在实际请求中填写的是不是我做错了什么我收到您的 AccountSid 或 Au
如何管理将 DateTime 的 null 对象解析为 DBNULL 与 ADO.NET 一起使用

我有两个 DateTime 对象 BirthDate 和 HireDate 它们被正确格式化为字符串当我将它们传递到数据访问层时需要将它们解析为 DateTime 对象 DateTime hD DateTime Parse hire D
C++：如何要求一种模板类型派生自另一种模板类型

在比较运算符中 template
如何用Python提取网页的某些部分

目标网页 http www immi gov au skilled general skilled migration estimated allocation times htm http www immi gov au skilled

如何用Python提取网页的某些部分

如何用Python提取网页的某些部分 的相关文章

随机推荐

热门标签

如何用Python提取网页的某些部分的相关文章