如何使用 BeautifulSoup 获取选项文本

2023-11-23

我想使用 BeautifulSoup 来获取以下 html 中的选项文本。例如：我想获取 2002/12 、 2003/12 等。

<select id="start_dateid">
<option value="0">2002/12</option>
<option value="1">2003/12</option>
<option value="2">2004/12</option>
<option value="3">2005/12</option>
<option value="4">2006/12</option>
<option value="5" selected="">2007/12</option>
<option value="6">2008/12</option>
<option value="7">2009/12</option>
<option value="8">2010/12</option>
<option value="9">2011/12</option>
</select>

获取内容的最佳方式是什么？现在我正在使用以下代码，但我不知道如何使用 beautiful soup 来实现这一点。如果 html 文件中有多个选定区域，结果将不正确。这是我到目前为止所拥有的：

    import urllib2
    from bs4 import BeautifulSoup
    import lxml

    soup = BeautifulSoup(urllib2.urlopen("./test.html").read(),"lxml");
    for item in soup.find_all('option'):
            print(''.join(str(item.find(text=True))));

你不必使用lxml这里。我在我的机器上安装它时遇到问题，所以我的答案没有使用它。

from bs4 import BeautifulSoup as BS
import urllib2

soup = BS(urllib2.urlopen("./test.html").read())
contents = [str(x.text) for x in soup.find(id="start_dateid").find_all('option')]

这样，您就可以避免 html 文件中多个选择区域的问题，因为我们首先限制id='start_dateid'，这向您保证您有权利<select>，因为在每个 html 文档中，每个 html 元素必须有一个唯一的id属性，如果它有一个id属性。然后，我们要寻找所有的<option>标签仅在that <select>标签，然后我们从每个标签中获取所有值<option>.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

htmlparsing

beautifulsoup

如何使用 BeautifulSoup 获取选项文本的相关文章

如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th
键入的完整命令行

我想获得输入时的完整命令行 This join sys argv 在这里不起作用删除双引号另外我不想重新加入已解析和拆分的内容有任何想法吗你太迟了当键入的命令到达 Python 时您的 shell 已经发挥了它的魔力例如引
Keras model.predict 函数给出输入形状错误

我已经在 Tensorflow 中实现了通用句子编码器现在我正在尝试预测句子的类概率我也将字符串转换为数组 Code if model model type universal classifier basic class probs
Java 页面爬行和解析之 Crawler4j 与 Jsoup

我想获取页面的内容并提取其中的特定部分据我所知此类任务至少有两种解决方案爬虫4j https github com yasserg crawler4j and Jsoup http jsoup org 它们都能够检索页面的内容并提取其
Flask 失败并显示“错误：导入‘X’时，引发了 ImportError”，但不显示错误。如何找到错误的根源？

当使用以下命令启动 Flask 应用程序时 flask run 我收到错误 Error While importing wsgi an ImportError was raised Usage flask OPTIONS COMMAND A
使用 NumPy 编写一个函数来计算具有特定公差的积分

我想编写一个自定义函数来以特定容差对表达式 python 或 lambda 函数进行数字积分我知道与scipy integrate quad人们可以简单地改变epsabs但我想使用 numpy 自己编写该函数 From 这篇博文 htt
App Engine NDB：如何访问属性的 verbose_name

假设我有这个代码 class A ndb Model prop ndb StringProperty verbose name Something m A m prop a string value 当然现在如果我打印 m prop 它会
Py2exe - Pmw WindowsError：[错误 3]

我正在尝试使用 Py2exe 构建独立的可执行文件我已经导入了 Pmw 类当我运行独立可执行文件时出现以下错误 Traceback most recent call last File py line 9 in
使用 subprocess.Popen() 或 subprocess.check_call() 时程序卡住

我想从 python 运行一个程序并找到它的内存使用情况为此我正在使用 l a out lt in txt gt out txt p subprocess Popen l shell False stdout subprocess PI
高级描述熊猫

有没有像 pandas 那样更高级的功能通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结就像这样 A count 1000 000
将 window.location 传递给 Flask url_for

我正在使用 python 在我的页面上当匿名用户转到登录页面时我想将一个变量传递到后端以便它指示用户来自哪里发送 URL 因此当用户单击此锚链接时 a href Sign in a 我想发送用户当前所在页面的当前 URL
使用 if 语句的网格网格和用户定义函数的真值不明确

假设我有一个函数f x y 足够光滑然而有些值仅在有限的意义上存在以sin x x的价值x 0只存在于极限 x gt 0 中在一般情况下我用一个来处理这个问题if陈述如果我在情节中使用它meshgrid我收到一条错误消息 Val
无法使用 python rasterio、gdal 打开 jp2 （来自哨兵）

我试图在 python 中将 jp2 栅格产品作为栅格打开但当我们使用 raterio 和 gdal 包时没有成功我收到此错误 RasterioIOError b4 jp2 not recognized as a supported f
Seaborn 中没有线性拟合的散点图

我想知道是否有办法关闭seaborn中的线性拟合lmplot或者是否有一个等效函数可以生成散点图当然我也可以使用 matplotlib 但是我发现 seaborn 中的语法和美学非常吸引人例如我想绘制以下情节 import sea
如何通过 Python Requests 库使用基本 HTTP 身份验证？

我正在尝试在 Python 中使用基本的 HTTP 身份验证我正在使用Requests https docs python requests org 图书馆 auth requests post http hostname auth HT
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
UnicodeDecodeError：部署到 Heroku 时，“utf-8”编解码器无法解码位置 0 中的字节 0xff

我尝试在heroku上部署我的简单django项目但我不明白如何解决这个问题这是git push heroku master remote Traceback most recent call last remote File tmp
如何使用 enumerate 来倒数？

letters a b c 假设这是我的清单在哪里for i letter in enumerate letters 将会 0 a 1 b 2 c 我怎样才能让它向后枚举如 2 a 1 b 0 c 这是一个很好的解决方案并且工作完美 i
MoviePY 无法在 Windows 上检测 ImageMagick 二进制文件

我刚买了一台新笔记本电脑想要设置MoviePY在那新的Windows 64x Python3 7 0 机器我对所有内容都进行了三次检查但是当涉及到我的代码的文本部分时它向我抛出了这个错误 OSError MoviePy Error
如何同时接受int和float类型的输入？

我正在制作一个货币转换器如何让 python 同时接受整数和浮点数我就是这样做的 def aud brl amount From to ER 0 42108 if amount int if From strip aud and to

随机推荐

SQL 错误：ORA-02000：创建基于标识列的表时缺少 ALWAYS 关键字

我尝试在表上创建一个自动递增列正如我在此看到的post有两种方法使用 Identity 列的第二种实现是一个更优雅的解决方案但是当我尝试实现它时出现以下错误 Error at Command Line 3 Column 31 Err
散点图中的颜色编码误差线

我正在尝试创建一个森林地块 with R plotly我想通过相应的 p 值对效应大小点及其误差线进行颜色编码以下是玩具数据 set seed 1 factors lt paste0 1 25 age effect sizes lt
为什么 Devise 将注册错误重定向到不同的页面？

我创建了新的 Rails 项目仅使用生成的主页控制器来测试它我的设计型号是User 所以注册页面是http localhost 3000 users sign up 如果我触发错误例如在未提供密码的情况下提交表单我会被重定向到ht
UIView alpha = 0 导致触摸被删除到下面的视图

因此我创建了一个玻璃窗格或自定义 UIView 来处理触摸该玻璃窗格位于其他视图例如虚拟 UIButtons 之上当我将 alpha 设置为 0 时触摸实际上会被玻璃视图下方的视图拦截这是错误的但是当我将 alpha 设置为
如何在 iTextSharp 中将 PDF 转换为文本文件

我必须从 PDF 文件中检索文本但使用下面的代码我只得到空文本文件 for int i 0 i lt n i pagenumber i 1 filename pagenumber ToString while filename Lengt
如何在 imacros 中使用 JavaScript？

我不知道如何在 JavaScript 中使用 imacros 我查看了他们的帮助在 Stack Overflow 上看到了无数的例子但不知道缺少什么任何地方都没有明确解释这是我尝试过的使用他们的帮助文件中解释的示例 http wi
如何防止 FileUpload 控件在回发时被清除？ [复制]

这个问题在这里已经有答案了我在使用 FileUpload 控件时遇到了一些问题想知道是否可以获得一些帮助在我的页面上我有一个 FileUpload 控件和一个下拉列表因此用户浏览到他们想要的文件然后从下拉列表中选择一个选项这
Google Drive API 如何找到文件的路径？

我试图在使用 Google Drive API 获取文件列表时找到文件的路径现在我可以获取文件属性当前仅获取校验和 id 名称和 mimeType results globalShares service files list pag
getWindowVisibleDisplayFrame() 在 Android 2.2、2.3 中给出不同的值（但不是 2.3.3）

我有一个Activity它使用 getWindow getDecorView getWindowVisibleDisplayFrame rectangle 确定可用的屏幕空间并决定放置图像的位置单击硬件后退按钮离开后返回活动Activ
hibernate @ManyToMany 双向急切获取

我有一个我认为应该很常见的问题但我找不到答案我有 2 个对象组和用户我的课程看起来像这样 class Group ManyToMany fetch FetchType EAGER List
使用 Rcpp 在 R 包中添加外部库

我正在尝试开发一个 R 包它使用Sundials用于求解微分方程的 C 库为了不让用户安装该库我将该库的源代码放在我的包中我已将库中的所有头文件放入 inst include sundials 2 6 2和 c文件在src sund
如何使用 QTextEdit 结束行

我正在尝试创建QTextEdit有一些文本在这段文本中我有行尾字符 n 但它不被接受QTextEdit对象整个文本显示没有任何中断有什么理由吗如果您使用的是 Qt 4 3 或更高版本那么您可以使用您可以使用以下命令关闭富文本编
如何创建 dotnet core 单个可执行文件

我想将我的 dotnet core 项目配置为编译为单个可执行文件该项目与使用生成的项目类似dotnet new version 1 0 0 buildOptions debugType portable emitEntryPoint t
为什么使用 QuantifiedConstraints 指定类型类的子类还需要子类的实例？

我正在尝试多种无标签编码Free LANGUAGE PolyKinds LANGUAGE TypeSynonymInstances LANGUAGE TypeFamilies LANGUAGE Rank2Types LANGUAGE Fle
如何从文本输入将锚标记添加到 URL

我希望能够在评论字段中获取用户输入的文本并检查 URL 类型表达式如果存在则在显示评论时添加锚标记到 url 我在服务器端使用 PHP 在客户端使用 Javascript 带有 jQ uery 所以我应该等到 URL 显示之前才检查它
对 XML 模式进行版本控制的最佳实践是什么？

我经常需要为不同的基于 XML 的导入例程设计 XML 模式很明显 XML 模式会随着时间的推移而发展或者它们可能包含需要修复的错误因此捕获模式的版本并拥有某种机制来绑定特定版本非常重要目前我有两种情况该错误是在架构中发现的并且
将 2D 数组组合到 3D 数组

你好我有 3 个 numpy 数组如下所示 gt gt gt print A 1 0 0 3 0 0 5 2 0 2 0 0 1 2 1 gt gt gt print B 5 9 9 37 8 9 49 8 3 3 3 1 4 4 5
确定浮动元素中的换行位置

假设我有六个 div 容器内的元素 div 这六个 div 中的每一个都是一个正方形并且具有 CSS 样式float left应用默认情况下当它们到达容器的边缘时 div 他们会包裹起来现在我的问题是使用Javascript 是否
实现可扩展性的最佳数据访问范例是什么？

微软提供了许多不同的数据访问选项哪一种最适合可扩展的应用程序 Linq 我们应该使用 Linq 吗这看起来确实很简单但如果您了解 SQL 它确实会有帮助我还听说您无法使用 Linq 在 ASP NET 中运行异步查询因此我想知道它
如何使用 BeautifulSoup 获取选项文本

我想使用 BeautifulSoup 来获取以下 html 中的选项文本例如我想获取 2002 12 2003 12 等

如何使用 BeautifulSoup 获取选项文本

如何使用 BeautifulSoup 获取选项文本 的相关文章

随机推荐

热门标签

如何使用 BeautifulSoup 获取选项文本的相关文章