提取 HTML 表单的字段名称 - Python

2024-04-24

假设有一个链接“http://www.someHTMLPageWithTwoForms.com”，它基本上是一个具有两种表单（例如表单 1 和表单 2）的 HTML 页面。我有这样的代码...

import httplib2
from BeautifulSoup import BeautifulSoup, SoupStrainer
h = httplib2.Http('.cache')
response, content = h.request('http://www.someHTMLPageWithTwoForms.com')
for field in BeautifulSoup(content, parseOnlyThese=SoupStrainer('input')):
        if field.has_key('name'):
                print field['name']

这将返回属于 HTML 页面的 Form 1 和 Form 2 的所有字段名称。有什么方法可以只获取属于特定表单的字段名称（仅比方说表单 2）？

如果只有两种形式，您可以尝试以下一种：

from BeautifulSoup import BeautifulSoup

forms = BeautifulSoup(content).findAll('form')
for field in forms[1]:
    if field.has_key('name'):
            print field['name']

如果它不仅仅是关于第二种形式，你可以让它更具体（通过 id 或类属性

from BeautifulSoup import BeautifulSoup

forms = BeautifulSoup(content).findAll(attrs={'id' : 'yourFormId'})
for field in forms[0]:
    if field.has_key('name'):
            print field['name']

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Parsing

提取 HTML 表单的字段名称 - Python 的相关文章

了解 Beautiful Soup 中的 Find() 函数

我知道我想做的事情很简单但这让我感到悲伤我想使用 BeautifulSoup 从 HTML 中提取数据为此我需要正确使用 find 功能这是我正在使用的 HTML div class audit div class profile
如何使用Python将RGB565字节数组转换为RGB888字节数组？

根据我的问题RGB888 转 RGB565 https stackoverflow com questions 61519934 how can i use opencv python to convert rgb888 to rgb565
lxml 中的通配符命名空间

如何使用 xpath 忽略 xml 命名空间进行查询我正在使用 python lxml 库我尝试了以下解决方案this https stackoverflow com questions 13463871 xpath selecting
Python数据框将列表列分解为多行[重复]

这个问题在这里已经有答案了我有一个像这样的数据框 desc id info a b c 2 type u v w 18 tail 三列 desc id info desc 是一个列表我想要这个 des id info a 2 type
自 1.4.0 版本以来，sphinx_rtd_theme 不再是硬依赖项

C Users Administrator Desktop item code serv documents api gt 制作 html 运行 Sphinx v1 6 2 加载腌制环境失败无法获取属性 WarningStream
SQLAlchemy 闭包表关系定义

我最近开始使用 SQL Alchemy 开展一个涉及攀岩区域和路线的项目区域是分层的因为单个区域可以包含多个区域而多个区域又可以包含其他区域路线直接与单个区域关联但也与该区域的父区域关联等等为了实现这一点我选择使用Bill
Pythonic方式逐行读取文件？

以下两种方法中逐行读取文件的 Pythonic 方法是什么 with open file r as f for line in f print line or with open file r as f for line in f read
Keras AttributeError：“顺序”对象没有属性“predict_classes”

我试图按照本指南找到模型性能指标 F1 分数准确性召回率 https machinelearningmastery com how to calculate precision recall f1 and more for deep l
将 unique_ptr 与 boost python 结合使用 - boost::shared_ptr 有效，但 unique_ptr 无效

这可能与以下问题相同 Boost Python 没有 to python for std unique ptr https stackoverflow com questions 20590205 boost python no to py
如何读取 10 位原始图像？其中包含 RGB-IR 数据

我想知道如何从我的 10 位原始它有 rgb ir 图像数据数据中提取 RGB 图像如何使用 Python 或 MATLAB 进行阅读拍摄时的相机分辨率为 1280x720 室内照片图片下载 https drive google c
对seaborn图中的分类x轴进行排序

我正在尝试使用 seaborn 散点图绘制数据框中前 30 的值如下所示同一图的可重现代码 import seaborn as sns df sns load dataset iris function to return top 30
如何在Python中打印出字母表中的第n个字母？

ASCII 数学似乎在 Python 中不起作用一 5 不起作用如果没有字母数组如何快速打印出字母表中的第 n 个字母我天真的解决方案是这样的 letters A B C D E F G H I J K L M N O P Q R
读取 JSON 文件并将其漂亮打印到另一个文件

我有一个复杂嵌套的 json 文本文件它是文本文件中的一长行有什么方法可以读取文件在 python 中并将 json 缩进漂亮地打印到新的文本文件中吗使用读取文件json load 并使用json dump 在指定缩进值时将
如何以编程方式关闭wx.DirDialog？

我有 wxpython 应用程序可以在单击按钮时打开 wx DirDialog dlg wx DirDialog self Choose a directory style wx DD DEFAULT STYLE if dlg ShowM
PySide2/QML 填充 Gridview 模型/委托并为其设置动画

我是 QML 的新手正在寻求以下几点帮助如何基于 TextField 输入如 Regex 通过 PySide2 过滤 Gridview 模型中的 QAbstractListModel 数据标题如何在鼠标悬停时为 Gridview
捕获 CommandOnCooldown 错误

我正在制作一个有冷却时间的不和谐机器人并且我正在尝试制作一个事件当CommandOnCooldown发生错误时机器人会通过私信告诉他们需要等待多长时间这是我的代码看起来一切正常但它不知道 retry after 意味着什么 bo
在 python 中将数组作为参数传递

我是Python新手现在我需要声明大小为 20 的数组并将该数组传递给函数需要数组的函数如下 function args The args是一个输入function 谁能帮我如何在 python 中传递数组当你说数组时我假设你
Python 中的延迟求值/惰性求值

我想延迟对类实例的成员函数的调用的评估直到该实例实际存在最小工作示例 class TestClass def init self variable 0 self variable 0 variable 0 def get variabl
在 python 中使用 org.mpris.mediaplayer2.player PlaybackStatus 属性

The 规格页 http specifications freedesktop org mpris spec latest Player Interface html summary对于这个特定的接口说 PlaybackStatus s P
无法比较类型“ndarray(dtype=int64)”和“str”

Example of data that I want to replace 数据具有以下属性购买 V 高高中低维持 V 高高中低门 2 3 4 5 更多 2 4人以上 lug boot 小中大安全性低中高这就是

随机推荐

当我尝试移动 Pygame 时，玩家回到初始位置

当我移动玩家时当我按住右箭头时他会移动 10 个像素当我释放按键时他会返回到初始位置顺便说一句你不需要告诉我当我按右时他会向左移动我知道这是代码 import pygame pygame init WIDTH 1000 HE
为什么 Java 中不能抛出和捕获对象？ [复制]

这个问题在这里已经有答案了可能的重复你可以在 Java 中添加什么 https stackoverflow com questions 5749898 what can you throw in java 为什么我不能在 Object
如何将音频从浏览器流式传输到 WebRTC 本机 C++ 应用程序

到目前为止我已成功运行以下示例 WebRTC 原生 C 到浏览器视频流示例 http sourcey com webrtc native to browser video streaming example 该示例展示了如何将视频从本机
React Native - 如何查看 AsyncStorage 中存储的内容？

我将一些项目保存到AsyncStorage在 React Native 中我使用 chrome 调试器和 iOS 模拟器不使用 React Native 使用常规 Web 开发localStorage 我能够看到存储的localStor
您能解释一下流的概念吗？

我知道流是字节序列的表示每个流都提供了向其给定的后备存储读取和写入字节的方法但流的意义何在为什么我们与之交互的不是后备存储本身不管出于什么原因这个概念并不适合我我读过很多文章但我想我需要一个类比或其他东西选择流这个词是因
Xcode 附加到进程不显示 NSLog

我刚刚开始使用 Apple Watch 我找到了来自五分钟观察套件 http www fiveminutewatchkit com blog category Xcode 让 iOS 应用程序和手表套件应用程序都在模拟器中运行并且两个进
mongod，mac os x - rlimits警告[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我一直在我的 mac os x 10 8 上使用 mongo 昨天突然在我的日志中出现了这个警告当启动 shell 时它也出现了警告软限制太低
在模拟的 HttpContextBase 上设置属性

我正在开发一个 ASP NET MVC 应用程序并尝试针对控制器操作编写一些单元测试其中一些操作 HttpContext 上的属性例如 Session Request Cookies Response Cookies 等在弄清楚如何
OpenTok - 如何手动发布/取消发布？

我查看了这些链接 http www tokbox com opentok api tools js documentation overview publish html http www tokbox com opentok api to
无法获取未知属性“组装”

所以昨天一切都很好但现在 Android Studio 和我的项目抛出了这个错误 ERROR Could not get unknown property assemble for task patternjkh assembleDeb
android AlertDialog 具有透明背景

我有一个自定义的 AlertDialog 我想使其背景完全透明通常为了使活动完全透明我会执行以下操作将背景设置为 00000000在 xml 布局中在清单集中android theme android style Theme Hol
如何避免在php中刷新时重新发送数据

我有一个页面 index php 其中有一个名为 add users php 的链接在 add users php 中我接受用户信息并返回到同一页面 index php 其中信息通过后操作传入并插入到数据库中当我刷新页面或点击后退按钮
如何在 Swift 中打开 URL？

openURL已在 Swift 3 中弃用任何人都可以提供一些如何替换的示例openURL options completionHandler 尝试打开网址时有效吗所有你需要的是 guard let url URL string htt
C++ 中有标准的日期/时间类吗？

C stl 有标准时间类吗或者我是否必须在写入流之前转换为 c 字符串例如我想将当前日期时间输出到字符串流 time t tm ostringstream sout sout lt lt tm lt lt ends 在本例中我将当
有没有好的方法来检查 Datastax Session.executeAsync() 是否引发异常？

我试图通过调用来加速我们的代码session executeAsync 代替session execute 用于数据库写入我们有数据库连接可能会关闭的用例目前是之前的execute 当连接丢失集群中没有可访问的主机时抛出异常我们可
如何检查字符串是否是数字？ [复制]

这个问题在这里已经有答案了我有一个 GPA 计划它适用于equalsIgnoreCase 方法比较两个字符串即字母 a 与用户输入检查他们是否输入 a 但现在我想添加一个异常其中包含当输入数字时执行的错误消息我希望程序意识到整数
与 C++ 中的对象数组混淆

所以我首先学习了Java 现在我正在尝试转向C 我在让数组正常工作方面遇到了一些困难现在我只是想创建一个对象 Player 的数组并用一个对象填充它但我收到错误 Player players new Player 1 players 0
Pydub 按样本切片音频片段

假设我有两个采样率相同的音频片段它们是从 Pydub 中的 wav 文件导入的并且假设我知道哪个更短现在假设我想将较长的音频文件分成两个片段以便第一个片段与较短的音频文件具有完全相同的长度精确到相同的样本数量并将这两个片段中的每
在离散 ggplot x 轴两侧添加不同数量的额外空间

我有一个带有离散 x 轴的图我想调整刻度两侧的额外空间使其左侧较小右侧较大以便长标签适合 scale x discrete expand c 0 1 不是我的朋友因为它总是同时在双方工作这个问题 https stackoverf
提取 HTML 表单的字段名称 - Python

假设有一个链接 http www someHTMLPageWithTwoForms com 它基本上是一个具有两种表单例如表单 1 和表单 2 的 HTML 页面我有这样的代码 import httplib2 from Beautifu

提取 HTML 表单的字段名称 - Python

提取 HTML 表单的字段名称 - Python 的相关文章

随机推荐

热门标签