从 BeautifulSoup 结果中获取表单“action”

2024-01-23

我正在为一个网站编写一个 Python 解析器来自动完成一些工作,但我不太喜欢 Py 的“re”模块(正则表达式),并且无法使其工作。

req = urllib2.Request(tl2)
req.add_unredirected_header('User-Agent', ua)
response = urllib2.urlopen(req)
try:
    html = response.read()
except urllib2.URLError, e:
    print "Error while reading data. Are you connected to the interwebz?!", e

soup = BeautifulSoup.BeautifulSoup(html)
form = soup.find('form', id='form_product_page')
pret = form.prettify()

print pret

Result:

<form id="form_product_page" name="form_1362737440" action="/download/791055/164084/" method="get">
<input id="nojssubmit" type="submit" value="Download" />
</form>

事实上,代码已经完成,正是我开始所需要的。现在,我想知道应该以哪种方式从“form”标签中提取“action”属性。这只是我需要从 BeautifulSoup 响应中得到的。

我尝试过使用form = soup.find('form', id='form_product_page').parent.get('action')但结果是“无”。我想要提取的是例如“/download/791055/164084/”。这在链接的每个 URL 上都是不同的。


Variables (example):
tl2 = http://example.com http://example.com
ua = Mozilla Firefox / 14.04

您可以一步完成:

action = soup.find('form', id='form_product_page').get('action')
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

从 BeautifulSoup 结果中获取表单“action” 的相关文章

随机推荐

  • 如何从纬度和经度获取完整的地址?

    我想从 android 中的纬度和经度获取以下值 街道地址 市 州 Zip 完整地址 如何实现这一目标 Geocoder geocoder List
  • 在非角度页面上使用量角器测试登录

    我正在尝试使用量角器进行 e2e 测试 但首先我需要登录非角度页面 我尝试按照指示直接使用 webDriverhere http ng learn org 2014 02 Protractor Testing With Angular An
  • Xamarin Forms 在模拟器和设备上项目空白谷歌地图

    I have created a cross platform App using Xamarin forms On Mac Book Pro el Capitan I need to use maps in it thus using X
  • 错误:“在清单中找不到版本代码。”

    我正在尝试构建签名的应用程序包 以便发布 我所做的只是更新操作系统版本和一些图形 该应用程序在 ADK 上运行得很好 当构建签名的 apk 时 我收到以下错误消息 在清单中找不到版本代码 这是错误日志 由以下原因引起 com android
  • 英特尔编译器值得吗? [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 非常简单 是英特尔编译器 http software intel com en us intel compilers 值得入手吗 我主要从事系统
  • Ubuntu 中的 PostgreSQL pg_dump 语法错误

    在 ubuntu 16 04 中 当我想运行 pg dump 时 它不起作用 我收到此错误语法错误 怎么了 postgres pg dump db name gt db name1 sql postgres postgres ERROR s
  • from __future__ import ... 能否保证 Python 2 和 3 的兼容性?

    我对热身 Python 2 还是 Python 3 不感兴趣 问题 尽管最近的一个 https stackoverflow com q 5478518 321973我发现已经一岁多了 但我偶然发现 如果您的文件开始 您可以在 Python
  • 如何清除 Objective-C 中常驻的脏内存?

    我观看了 Apple 的 WWDC 2010 视频 Advanced Memory Analysis with Instruments 从中我发现了大量常驻脏内存 我意识到拥有如此多的常驻脏内存是一件坏事 这可能是我的应用程序崩溃的原因 但
  • 我们可以在 Java 中将两种字体样式组合在一起吗?

    我正在尝试更改 a 的字体JLabel所以两者都是BOLD and ITALIC 但似乎没有定义静态字段来执行此操作 我们如何将两种样式结合起来以获得粗斜体字体 此代码将通过使用静态字段以粗体形式完成此操作BOLD 但没有为粗体和斜体定义字
  • CKeditor 添加类到 img 标签

    我正在尝试向 CKeditor 中任何插入的 img 标签添加一个类 我尝试了各种方法 但似乎无法弄清楚这个插件的设置是如何工作的 虽然文档很多 但只提到需要添加代码 但没有提到应该添加到哪里 文件很多 我尝试将其添加到 config js
  • google.script.host.close 关闭对话框不起作用

    我正在尝试关闭用以下命令打开的无模式对话框 var html HtmlService createHtmlOutputFromFile dialog setSandboxMode HtmlService SandboxMode IFRAME
  • Symfony 4 Doctrine 无法从控制台运行 [2002] 没有这样的文件或目录

    我正在使用 symfony 4 运行学说控制台命令时会发生此错误 In AbstractMySQLDriver php line 108 An exception occurred in driver SQLSTATE HY000 2002
  • 添加自定义目录(源和规范)以在 Rails 3 项目中进行自动测试

    我有一个 Rails 3 应用程序 它使用 RSpec2 作为我的测试框架 并且我能够使用自动测试来观察我的模型和规范目录的更改 并在文件更改时重新运行我的规范套件 我想添加一个目录 其中包含一些自定义类 RAILS ROOT lib so
  • For循环和if语句

    我正在使用以下 for 循环 for int intPrjName 0 intPrjName lt arrPrjName count intPrjName 我在 for 循环下有一个 if else 语句 其中else块显示警报消息 假设数
  • onNavigationItemSelected 在 NavigationView 中不起作用

    请有人帮助我处理导航抽屉中的片段 由于某种原因我无法让它们工作并且所有代码看起来都是正确的 Here https github com Matt Hutchings The Midlands Meander是源代码的链接 使用此代码 nav
  • 使用 angularjs/ui-bootstrap 制作手风琴并使用 ng-model

    我使用 angularJs 和 bootstrap 我制作了一个手风琴 其中我放置了一个选择来选择过滤器的值和不起作用的 data ng model 如果他不在手风琴中 则选择可以工作 这是我的代码
  • 在没有指针的函数中使用函数原型

    我的导师提到在其他函数中使用函数作为参数 我不是说使用指针 这可能吗 我在下面显示 我不明白他做了什么 谁能用例子解释一下吗 谢谢大家的赞赏回答 使用风格是 int test double abc double bla bla 函数是 do
  • C# 中的猴子修补

    是否可以在运行时扩展或修改 C 类的代码 我的问题具体围绕 Monkey Patching Duck Punching 或元对象编程 MOP 就像 Groovy Ruby 等脚本语言中发生的那样 对于那些今天仍然在这个问题上绊倒的人来说 确
  • SVN 显示日志不起作用

    如何在不设置 r 向所有人 所有内容读取 的情况下使用显示日志功能 我的 authz 文件中有几个组 它看起来像这样 groups Profs dave bruno franck Team1 1036091 1036103 1036087
  • 从 BeautifulSoup 结果中获取表单“action”

    我正在为一个网站编写一个 Python 解析器来自动完成一些工作 但我不太喜欢 Py 的 re 模块 正则表达式 并且无法使其工作 req urllib2 Request tl2 req add unredirected header Us