Python 从网站上抓取表格？

2024-03-30

我想了解 treasury.gov 网站上提供的所有国债收益率。

https://www.treasury.gov/resource-center/data-chart-center/interest-rates/Pages/TextView.aspx?data=yieldAll https://www.treasury.gov/resource-center/data-chart-center/interest-rates/Pages/TextView.aspx?data=yieldAll

我将如何获取这些信息？我假设我必须使用 BeautifulSoup 或 Selenium 或类似的东西（最好是 BS4）。我最终想将这些数据放入 Pandas DataFrame 中。

这是使用 requests 和 beautifulsoup 获取表中数据的一种方法

import pandas as pd
import requests
from bs4 import BeautifulSoup

url = 'https://www.treasury.gov/resource-center/data-chart-center/interest-rates/Pages/TextView.aspx?data=yieldAll'

r = requests.get(url)
html = r.text

soup = BeautifulSoup(html)
table = soup.find('table', {"class": "t-chart"})
rows = table.find_all('tr')
data = []
for row in rows[1:]:
    cols = row.find_all('td')
    cols = [ele.text.strip() for ele in cols]
    data.append([ele for ele in cols if ele])

result = pd.DataFrame(data, columns=['Date', '1 Mo', '2 Mo', '3 Mo', '6 Mo', '1 Yr', '2 Yr', '3 Yr', '5 Yr', '7 Yr', '10 Yr', '20 Yr', '30 Yr'])

print(result)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

selenium

DataFrame

beautifulsoup

Python 从网站上抓取表格？的相关文章

如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
如何在 pytest 中将单元测试和集成测试分开

根据维基百科 https en wikipedia org wiki Unit testing Description和各种articles https techbeacon com devops 6 best practices inte
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
当鼠标悬停在上面时，intellisense vscode 不显示参数或文档

我正在尝试将整个工作流程从 Eclipse 和 Jupyter Notebook 迁移到 VS Code 我安装了 python 扩展它应该带有 Intellisense 但它只是部分更糟糕我在输入句点后收到建议但当将鼠标悬停在其上方
无法在前端使用 JavaScript Fetch API 将文件上传到 FastAPI 后端

我正在尝试弄清楚如何将图像发送到我的 API 并验证生成的token那是在header的请求到目前为止这就是我所处的位置 app post endreProfilbilde async def endreProfilbilde requ
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
如何读取Python字节码？

我很难理解 Python 的字节码及其dis module import dis def func x 1 dis dis func 上述代码在解释器中输入时会产生以下输出 0 LOAD CONST 1 1 3 STORE FAST 0 x
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
运行多个并行 Selenium WebDriver 会话

我想知道我们是否能够运行两个 Selenium WebDriver 会话或者如何使用同一个 WebDriver 处理两个浏览器窗口并并行运行它们尝试像下面这样定义您的 TestNg 套件然后它将同时开始运行两者
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

Spring Boot中无法拦截和操作HttpServletResponse

我有一个要求Base64解码我的 Spring Boot 服务收到的每个 JSON 请求负载 JSON 有效负载将是Base64在使用 HTTP 发布之前在客户端进行编码POST方法此外我还需要Base64在呈现给调用客户端应用程序之前
结构体接口

当你定义一个新的struct最好也定义该类型的接口即 setter 和 getter 函数或直接通过 and gt 运营商 EDIT纯 C 编程这取决于您的结构是否是抽象数据类型如果您在标头中公开结构定义则定义访问器没有任何意义
如何使用简单注入器将依赖项注入到 WCF 属性中

我有一堆与 REST 和 SOAP 配合使用的 WCF 服务我创建了一个 WCF 属性用于检查当前 httpcontext 是否存在如果存在则使用 cookie 身份验证否则使用自定义 WCF 身份验证我的属性如下所示 Publ
Android 颜色通知图标

我正在开发一个为用户创建通知的应用程序我希望图标在状态栏中显示为白色但在下拉通知菜单中显示时显示为蓝色以下是 Google Store 应用执行相同操作的示例状态栏中的白色通知下拉菜单中的彩色通知我怎样才能复制这个我必须设置哪
pjax ：HTML 链接，其工作方式类似于浏览器后退按钮

我使用 pjax 进行网站导航我需要创建一个 HTML 后退按钮其工作方式与浏览器后退按钮完全相同但这应该是一个简单的 HTML 链接如何创建导航到上一页的 pjax 链接我搜索过所有主题似乎都与浏览器后退按钮有关这不是我想要
Apache Web 服务器在 60 秒后超时

我在 IBM Softlayer 中运行的 apache Web 服务器 php 在 60 秒后遇到超时这些是我的设置这些设置后httpd服务器重新启动 httpd conf TimeOut 300 Timeout 300 同时尝试两者
颤振行和列

我是一个颤振初学者如何创建无边框的 4 2 表格列之类的元素我尝试过但没有得到我想要的对齐方式像这样 https i stack imgur com i1a3f jpg 有人可以指导我如何解决这个问题吗这是我的有状态小部件的构建方
如何改进 clisp 错误消息？

我已经接触过一些clisp 有点令人困惑的是它没有打印出错误所在的行号或者至少给出错误所在的一般提示在某些情况下这一定是可能的对吧有什么方法可以获得更好的错误消息吗正如我看到的大多数涉及 clisp 的问题一样答案可能是不要
请对我的示例 Python 程序进行代码审查 [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 我仍在学习
在 javascript 排序调用之前强制更新 element.innerHTML

这种情况的最佳实践是什么 1 用户点击对巨大的javascript数组进行排序 2 浏览器通过element innerHTML Sorting 显示 Sorting 3 浏览器对巨大的 javascript 数组进行排序 100 CPU
使用流畅语法的嵌套 GroupBy LINQ

我正在尝试使用流畅的即方法语法编写嵌套的 GroupBy LINQ 表达式这是我的课程和数据 class Person public String ZipCode Gender Name private static List
NotImplementedError：无法对未注册的加载器类型执行此操作

我正在编写一个小脚本来生成 HTML 文件为此我正在使用jinja2 这是我的脚本在jinja2文档 coding utf 8 from jinja2 import Environment PackageLoader env Envi
Nuget 包有什么意义？

也许我在这里做错了什么或者表达了纯粹的无知但我真的看不出 Nuget 包有什么好处我最近决定安装一些 Nuget 包来替换我的应用程序中的静态 DLL 当我检查包创建的文件夹时它们似乎包含许多不同版本的 DLL 所有这些都嵌套在一系列
重命名没有列名的 pandas 数据框的列[重复]

这个问题在这里已经有答案了我试图在 dataframe from dict 操作之后命名新数据帧的列只需使用 pandas dataframe from dict 函数 df pd DataFrame from dict my dict
如何在python2.7中安装gtk？

我正在使用 Debian 6 04 和 Python 2 7我编译了Python 2 7 configure make make install 在控制台中 gt python2 7 Python 2 7 3 default Jul 28
如何排序 unsort： array(1).sort 转换 array(2) -> array(3).unsort （反转 array(1).sort

如何对结果进行排序操作和取消排序假设我有一个浮点数组p1 0 15 0 3 0 25 0 12 其排序为 p2 sort p1 一个函数操作p2作为输入导致p3 p3 f p2 x y 对于某些功能f 我怎样才能取消排序p3以最聪明
Jmeter中的“延迟时间”与“连接时间”有什么区别？

我是jmeter 3 1用户我不清楚延迟时间与连接时间的区别事实上在jmeter官方文档中是这样说的新的连接时间指标 connectTime 表示建立连接的时间默认情况下它不会保存到 CSV 或 XML 要保存它请添
为什么当我导入正在打印的同一文件时，Python 会打印两次输出？

我一直在玩Python 因为我是Python的初学者我写了以下 Parent 课程这是我从 Udacity 在线课程中阅读的继承 py 文件 import inheritance Why this import statement c
我怎样才能使其成为类的私有成员或方法，以便可以在静态库本身内部而不是在库外部访问它？

我想为 Objective C 中的以下类准备小型静态库 A类 B类 C类我想将这些类包含在静态库中现在 A 类可以访问 B 类或 C 类方法的公共成员现在当我将上述库集成到其他项目中时我准备了D类只能访问A类和B类不是 C 类
Python 从网站上抓取表格？

我想了解 treasury gov 网站上提供的所有国债收益率 https www treasury gov resource center data chart center interest rates Pages TextView a

Python 从网站上抓取表格？

Python 从网站上抓取表格？ 的相关文章

随机推荐

热门标签

Python 从网站上抓取表格？的相关文章