使用rvest，如何从submit_form()返回的对象中提取html内容

2024-03-27

我正在尝试从 pems.dot.ca.gov 下载一些流量数据，如下这个话题 https://stackoverflow.com/questions/28418770/using-rvest-or-httr-to-log-in-to-non-standard-forms-on-a-webpage.

rm(list=ls())
library(rvest)
library(xml2)
library(httr)
url <- "http://pems.dot.ca.gov/?report_form=1&dnode=tmgs&content=tmg_volumes&tab=tmg_vol_ts&export=&tmg_station_id=74250&s_time_id=1369094400&s_time_id_f=05%2F21%2F2013&e_time_id=1371772740&e_time_id_f=06%2F20%2F2013&tod=all&tod_from=0&tod_to=0&dow_5=on&dow_6=on&tmg_sub_id=all&q=obs_flow&gn=hour&html.x=34&html.y=8"
pgsession <- html_session(url)
pgform <-html_form(pgsession)[[1]]
filled_form <- set_values(pgform,
                          'username' = 'omitted',
                          'password' = 'omitted')
resp = submit_form(pgsession, filled_form)
resp_2 = resp$response
cont = resp_2$content

我检查了class()检查这些项目，发现 resp 是“会话”，resp_2 是“响应”，而 cont 是“原始”。我的问题是：如何正确提取 html 内容，以便我可以继续使用 XPath 从该页面中挑选出我想要的实际数据？我的直觉是我应该解析 resp_2 这是一个响应，但我就是无法让它工作。非常感谢您的帮助！

这应该可以做到：

pg <- content(resp$response)

html_nodes(pg, "table.inlayTable") %>% 
  html_table() -> tab

head(tab[[1]])
##                 X1      X2           X3           X4
## 1                          Data Quality Data Quality
## 2             Hour 8 Lanes   % Observed  % Estimated
## 3 05/24/2013 00:00   1,311           50            0
## 4 05/24/2013 01:00     729           50            0
## 5 05/24/2013 02:00     399           50            0
## 6 05/24/2013 03:00     487           50            0

（显然您需要修改列名称）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用rvest，如何从submit_form()返回的对象中提取html内容的相关文章

防止浏览器弹出警告窗口

我正在尝试在新窗口中打开 jsp 页面使用 JavaScriptwindow open产生浏览器警告并且在某些情况下 firefox 将默认阻止弹出窗口有没有办法解决这个问题这不是恶意应用程序它是内部用户工具大多数浏览器不会阻止
在浏览器中覆盖 TAB

如果我在输入字段中输入文本并按ENTER我所知道的所有浏览器的默认行为是提交表单但是如果我按ENTER在文本区域内添加新行每当我按下时有什么方法可以模仿这种行为缩进而不是提交表单 TAB在文本区域内 Bespin https be
为什么 Chrome 给 body 元素添加边距？ [复制]

这个问题在这里已经有答案了我有简单的 html 文档是进入身体的一种元素当我在 div 元素中设置 margin top 时 Chrome 会向 body 添加相同的边距边距仅在开发者工具中可见我的代码 div Test div
自动更改时 onChange 事件不起作用

我在一个选择框 usageDisplays 上有一个 onChange 事件它根据第一个选择框的选定值填充下一个选择框
我可以在 R 中并行读取 1 个大 CSV 文件吗？ [复制]

这个问题在这里已经有答案了我有一个很大的 csv 文件需要很长时间才能阅读我可以使用 parallel 或相关的包在 R 中并行读取此内容吗我尝试过使用 mclapply 但它不起作用根据OP的评论 fread来自data tab
如何使用正则表达式进行正确的输入验证？

我想让用户只输入整数或浮点数现在我只能输入整数它允许输入点或逗号无法找到正确的正则表达式来验证整数和浮点数
使用 CSS 格式化日期/时间或百分比值？

有没有办法使用 CSS 来使用特定格式格式化日期例如YYYY MM DD 或 MM DD YYYY 有或没有时间也可以将数字格式化为保留 2 位小数的百分比值例如5 4321987 显示为 5 43 我可能可以使用 JavaScrip
jQuery 输入事件在 IE 中的占位符上触发

我有一个输入字段input绑定到它的事件通过 jQuery 每次输入值更改时都应触发此事件我添加了一个占位符来告诉用户此输入字段的用途如果用户单击此输入字段input不应触发事件该值实际上不会改变只是占位符消失它在 Firefo
在网页上写乐谱[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我希望能够在网页中编写乐谱和和弦有没有可用的库例如用于数学的 Mathjax 如果没有那么还有其
计算数据框中每一行的 R 条件运行总和

我想创建一个等于 data Rating 的运行总和的列假设第 3 列和第 4 列中有两个条件成立特别是 data Year 换句话说这应该计算直到上一年为止每个 id 的评分累积总和它应该对数据框中的每一行大约 50 000 行
生成的表的行跨度导致额外的单元格

HTML table border 1 cellspacing 1 width 100 thead tr td class csstextheader width 70px td td class csstextheader width 7
如何将水平 ul 列表中的项目与图像垂直对齐？

我有以下 html 代码 div ul li a href index php site login About a li li a href index php site login FAQ a li li a href http twi
关闭 Godot 中的游戏

我正在使用 Godot 创建网页游戏为了关闭游戏我尝试使用 get tree quit 如果我在 IDE 上使用它它就可以工作当我在我的服务器上尝试它时导出项目后它不起作用我确信导出设置没问题我怎样才能关闭游戏并且如何添
访问动态创建的 Shiny 模块的返回值

我正在寻找构建一个闪亮的应用程序它动态创建返回简单表单的模块通过 callmodule 我有两个未解决的问题希望得到一些指导首先当向用户提供多个表单通过单击按钮时先前呈现的表单上的值将恢复为默认值如何停止这种行为以便值保
如何使用 grid.arrange 移动图例位置

我试图在一页中排列 4 个图将图例放在底部中心我用它来获取其中一个图的图例因为它们对于四个图来说是相同的 get legend lt function myggplot tmp lt ggplot gtable ggplot buil
如何在折线图中显示 Sep-12 格式的数据并抑制网格线和灰色背景？

我正在努力使日期格式正确数据已经是melt 格式数据中有四个变量碰巧共享相同的数据我只是想绘制一个简单的四线折线图每个变量作为一条单独的线并将 Sep 12 显示为最新数据点我正在使用旧的 ggplot 请随意我有两个问题第
R 中的 huxtable 即使有选项也默认为科学记数法(scipen=999)

我试图生成像样的桌子并在过去的一周尝试了很多软件包我的头在游泳今天早上开始使用 package huxtable 并试图摆脱科学记数法 x lt mtcars 1 5 1 2 x mpg lt x mpg 10000000 get s
如何像在浏览器中一样检索准确的 HTML

我正在使用 Python 脚本来呈现网页并检索其 HTML 它适用于大多数页面但对于其中一些页面检索到的 HTML 不完整我不太明白为什么这是我用来废弃此页面的脚本由于某种原因每个产品的链接不在 HTML 中 Link http
使用 MailTo 链接，我可以向发件人发送副本吗？

我们开发了一个非常简单的表单一旦提交就会填充一封电子邮件以发送支持票证这些电子邮件目前发送给我们的支持人员但如果我们也能向发件人发送一份副本那就更理想了我们正在使用 mailto 链接这可能吗例如我们的员工 Brad 填
如何使表格单元格的最小宽度为 3 位数字？

如何使表格中的每个单元格的最小宽度为 3 位数字且不会更大现在我正在硬编码min width 但我不喜欢硬编码一个值因为我将来可能想更改字体如果需要Javascript也没关系 table border 1 tr td 1 td td

随机推荐

捆绑包标识符与保留捆绑包标识符不同

我正在尝试在 iTunes 上上传我的应用程序为此我创建了一个应用程序 ID 并保留了一个包标识符在我的项目中我更改了 info plist 文件中的包标识符但是当我尝试在 itunes 上上传我的应用程序时它显示错误捆绑包
如何使模式弹出窗口随页面滚动其内容？

我有一个模式弹出窗口当它加载高于浏览器高度的内容时我无法向下滚动以查看其余信息相反背景可以滚动但弹出窗口不会相反我想让弹出窗口保持不变当用户向上或向下滚动时它会将弹出窗口保留在适当的位置并让他们滚动到内容的底部如果您在
为 libcurl 添加自签名 SSL 证书

我在我的 C 应用程序中使用 libcurl 与我设置的 HTTPS 服务器进行通信我在该服务器上生成了一个自签名证书我希望将其与curl 一起使用我知道将 CURLOPT SSL VERIFYPEER 设置为 0 可以绕过 SSL
SQL Server 2014 中具有多个条件的情况

我有一个表 FinancialTrans 其中有很多字段但其中只有 3 个字段与我有关 AcctID TransTypeCode DateOfTrans Field 4 Field 5 Field 6 123 TOLL 2016 06 0
如何在 yii 的更新视图中加载多选列表框中选定的列表项？

我有一个multiple select list box for Staff in Create Service Form 用于在创建新服务时选择多名员工为此我可以在一项服务上分配多名员工 I saved staff id字段为 mod
如何对特定文件夹设置777权限？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案如何对文件夹设置777权限我需要将以下文件夹的权限设置为777 管理包含模块安装我不知道如何在 Windows 7 中的特定文件
System.Runtime，Version=4.2.1.0，PublicKeyToken=b03f5f7f11d50a3a 的版本高于引用的程序集

我将 ASP NET CORE 应用程序从 sdk NET Core 2 0 升级到 NET Core 2 1 我可以在本地主机中运行该解决方案但是当我将其部署到另一台服务器时出现异常例外情况如下到目前为止我为解决该问题所做的步骤如
单击按钮后 React hooks useInterval 重置

我有钩子 useInterval 它每 10 秒自动下载一次数据但是我也有按钮可以在每时每刻手动下载数据当我单击按钮时我很难重新启动间隔计时器所以基本上如果间隔计数到 5 但我同时单击按钮间隔应该重新启动并在下载数据之前再次
link_to image_tag 与 Rails 中的内部文本或 html

我想用 Ruby on Rails 输出以下内容link to and image tag方法 a href Lorem Ipsum img src images menu arrow down gif a Rails 中什么是好方法您可
为什么在 window 对象中定义 body [重复]

这个问题在这里已经有答案了我只是在控制台上玩注意到如果我输入 body它返回这显然与window body 因此也返回了 Then document body也返回正如预期的那样因为身体是身体的一部分document对象据我所知
CakePhp - 关联数据未保存（但主模型数据确实保存）

所以我在 CakePhp 中有一个使用 Formhelper 的表单此表单中有两个关联模型 Booking 和 Guest 数据库表似乎设置正确因为页面通过模型中的关联足够准确地填充了值保存表单数据时会保存预订信息但不会保存宾客
如何找出Oracle死锁的原因

当使用多个用户测试我的应用程序时我遇到了 ORA 00060 死锁错误我不确定如何确定此错误的原因因此如果有人可以帮助我我将不胜感激我查看了为此事件生成的跟踪文件它显示了哪个查询导致了此事件 UPDATE TABLE A SET
Google Ads API - “失败，状态为“PERMISSION_DENIED” - “用户无权访问客户。”

我正在尝试使用 Google ads API 运行 Ubuntu 20 04 Python 3 9 客户端库工作的最低要求是 3 6 使用 google ads api V6 这是我的痛苦故事我创建了一个测试管理员帐户 A 生成了开发人员
如何使用 grunt-sass 编译多个 scss 文件

我正在尝试将多个 scss 文件编译为单个 CSS 文件这实际上有效但只获取第一个文件 sass Task dist files css test css sass scss 我们没有安装 ruby 所以 grunt contrib s
React Hooks：如何在 useEffect 中设置 State？

我正在尝试从 firebase 获取数据并使用 useState 挂钩将检索到的数据设置为我的状态我知道我的 API 调用正在工作因为我可以从 firebase 记录数据但当我使用 setState 时它并没有达到我的状态由于某种
为什么 R 有时会停止显示输出？

有时 R 会停止显示输出我输入数字 1 然后按回车键但什么也没有出现这种情况是在我按下窗口中的停止图标后发生的该图标用于停止长时间的计算我在 Mac 上使用 R 2 11 0 按 STOP 是否会导致 R 停止显示输出如何让
使用 C# 比较嵌套对象属性

我有一个方法可以比较两个对象并返回所有不同属性名称的列表 public static IList
在 Java 中使用嵌套枚举类型

我心中有一个涉及嵌套枚举的数据结构这样我就可以执行如下操作 Drink COFFEE getGroupName Drink COFFEE COLUMBIAN getLabel 如果有方法声明 someMethod Drink type s
从js数组中删除双引号

我有这种类型的数组 80 529299450867271 7 3884550841172976 80 528953669541707 7 3875715810979612 80 528714422417153 7 3867339810469
使用rvest，如何从submit_form()返回的对象中提取html内容

我正在尝试从 pems dot ca gov 下载一些流量数据如下这个话题 https stackoverflow com questions 28418770 using rvest or httr to log in to non s

使用rvest，如何从submit_form()返回的对象中提取html内容

使用rvest，如何从submit_form()返回的对象中提取html内容 的相关文章

随机推荐

热门标签

使用rvest，如何从submit_form()返回的对象中提取html内容的相关文章