如何使用 R 从需要 cookie 的 SSL 页面下载压缩文件

2023-12-27

我正在尝试从 https 页面下载一个文件，该页面需要按下“我同意”按钮，然后存储 cookie。如果这个答案在某个地方很明显，我很抱歉..

当我直接在 Chrome 中打开网页并单击“我同意”时，文件开始自动下载。

我尝试复制这个例子 https://stackoverflow.com/questions/10213194/use-rcurl-to-bypass-disclaimer-page-then-do-the-web-scrapping，但我不认为恒生网站实际上存储cookie/身份验证，所以我不知道这个例子是否应该是我所需要的。

除此之外，我认为 SSL 使身份验证变得复杂，因为我认为 getURL() 调用将需要像 cainfo = system.file("CurlSSL", "cacert.pem", package = "RCurl")) 这样的证书规范

我是 RCurl 的初学者，不知道这个网站是否相当困难，或者我是否只是错过了一些明显的东西。

谢谢你！

这更容易做到httr因为它设置了一切，以便 cookie 和 https 无缝工作。

生成 cookie 的最简单方法是让网站为您生成，通过手动发布“我同意”表单生成的信息。然后，您发出第二个请求来下载实际文件。

library(httr)
terms <- "http://www.icpsr.umich.edu/cgi-bin/terms"
download <- "http://www.icpsr.umich.edu/cgi-bin/bob/zipcart2"

values <- list(agree = "yes", path = "SAMHDA", study = "32722", ds = "", 
  bundle = "all", dups = "yes")

# Accept the terms on the form, 
# generating the appropriate cookies
POST(terms, body = values)
GET(download, query = values)

# Actually download the file (this will take a while)
resp <- GET(download, query = values)

# write the content of the download to a binary file
writeBin(content(resp, "raw"), "c:/temp/thefile.zip")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

webscraping

rcurl

如何使用 R 从需要 cookie 的 SSL 页面下载压缩文件的相关文章

orderBy 随递减排序和递增排序的变化

是否有一种标准方法可以按几列对 data frame 进行排序但会发生减少或增加的变化例如您可能希望按一个变量递减和下一个变量递增对 data frame 进行排序有没有类似的东西 mydf order mydf myvar
lme4：如何指定 2 个与随机截距的相关性，而不添加随机斜率之间的相关性

重新发布自stats stackexchange com https stats stackexchange com q 195385 33560 我试图在 R 的 lme4 包中指定一个模型其中随机截距和随机斜率之间有 2 个相关性但
在 R 中将本地日期时间转换为 UTC

如何将本地日期时间转换为以下格式 12 31 2014 6 42 52 PM R 中的 UTC 我试过这个 as POSIXct as Date 12 31 2014 6 42 52 PM format m d Y H M S tz UTC
如何规划庭院灯最有效的路线

我正在尝试挂一些庭院灯基于另一个问题 https cs stackexchange com questions 80134 christmas light route efficiency我问我意识到我需要一种算法来解决路由检查问题 h
不同的分位数：箱线图与小提琴图

require ggplot2 require cowplot d iris ggplot2 ggplot d aes factor 0 Sepal Length geom violin fill black alpha 0 2 draw
添加不同的标签以在 ggplot R 中的堆积条形图中显示总计？

我的问题有点类似如何添加文本标签以显示ggplot中堆叠比例条的每个条中的总数n https stackoverflow com questions 65201095 how to add text label to show total
为闪亮的应用程序创建桌面图标

当我在基本 R 提示中提供以下代码时我会在浏览器中打开一个闪亮的应用程序 shiny runApp C Myapp 我使用 Windows 7 我试图创建一个桌面图标以避免我的客户每次想要使用该应用程序时都键入上述代码我创建了一个桌面
R 中的 For 循环分配给数据框

运行 for 循环后我在分配给数据帧时遇到问题当我使用 print 时它给出了我的价值有什么解释吗 salesdate lt rep seq from as Date 2013 12 19 to as Date 2013 12 23
没有垂直线的直方图

当我创建直方图时它看起来很像这样 set seed 1 x lt 1 100 y lt x rnorm 50 y round y hist y Is there a way to make a histogram look a bit l
R Plotly 禁用图例单击和图例双击

我想使用 R Plotly 从服务器端禁用绘图图例选择我们看here https community plot ly t disable legend click functionality hiding traces 1345 2可以使
将 R 传单地图保存为 html：不包括图块

我正在尝试使用 saveWidget 或将 rmd 文件输出到 html 来保存 R 传单地图如下所述将传单输出保存为 html https stackoverflow com questions 30110377 saving lea
为什么 quosures 在 group_by() 中起作用，但在 filter() 中不起作用？

我正在构建一个函数我将根据字符串操作数据框在该函数中我将根据字符串构建一个列名称并使用它来操作数据框如下所示 library dplyr orig df lt data frame id 1 3 amt c 100 200 300
是否可以在 R 中创建自定义 pch 形状？

R 中的许多绘图函数都使用图形参数pch指定数据点的形状根据R 文档 https www rdocumentation org packages graphics versions 3 6 2 topics points 有 26 个矢量
如何在 ggplot2 中向 x 轴添加特定值？

我正在尝试在 ggplot2 中绘制图表我希望 x 轴显示 2 84 以及下面键入的序列除了在 Breaks 中输入所有精确值之外还有其他方法吗我尝试了谷歌但它没有解决我的问题 scale x continuous limits
根据第二个数据帧中的匹配创建新列

如果有两个数据框 top3df http dpaste com 1709875 and qw qw lt structure list id structure 1 25 Label c w01 w02 w03 w04 w05 w06 w0
将英寸高度的字符向量转换为厘米？

我得到一个字符向量 tibble H c 6 2 5 10 5 5 5 1 5 5 5 4 我想将其转换为厘米请告知我该怎么做有几种方法可以使用 1 阅读与fread粘贴到单个字符串后 library data table fread
ggplot2：图例中的斜体

我正在尝试编辑图例中的标签以便第一个标签 WT 为纯文本而后续 7 个标签为斜体我一直在使用element text face c plain rep italic 7 但这导致没有任何标签被转换为斜体我有点困惑为什么它不起作用因
在 R 中使用 ggplot2 叠加两个图

有两个数据框 df1 df2我需要使用 ggplot2 创建线图并显示在同一个图表上 df1 x y 2 30 4 25 6 20 8 15 df2 x y 2 12 4 16 6 20 8 24 用于绘制第一个 df p1 lt ggpl
R/ggplot2：如何匹配重叠区域图中的图例和绘图颜色？

我有两个面积图称为蓝色和绿色其中green大部分是在blue情节但在极少数点上它高于blue阴谋我想使用透明度说alpha 0 2对于两者并且还能够为每个指定颜色我现在的问题是自从green情节主要是在blue地块其
如何将带有几行代码的字符数组转换为 data.frame？

我有以下数组 my list lt c Jan 01 Dec 31 00 00 24 00 Jan 01 Jun 30 12 00 18 00 Jul 06 Dec 31 09 00 19 00 导致以下结果的最短代码是什么 x1 x2 x

随机推荐

搭建 dbcontext 时出现不明确的列名“name”错误

我正在尝试从现有数据库构建脚手架但该数据库有多个具有多个模式的表并且某些表具有相同的名称但在不同的模式中我认为这是我的问题的根源我想知道您是否已经遇到过类似的情况吗例如mySchema1 contacts and mySche
如何从字符串中查找斜杠出现的次数

如何使用 Excel VBA 宏查找字符串中正斜杠字符的出现次数老问题但我想我会通过在 Excel 论坛上找到的答案来提高答案的质量显然计数也可以使用找到 count Len string Len Replace string 答案
NodeJS：如何从文件中读取（最多）前 N 个字节？

在 NodeJS 中从文件中最多读取前 N 个字节的简洁健壮且优雅的方法是什么如果数据较少那么我不希望抛出错误如果有更多数据那么我不希望将其读入内存理想情况下无需安装外部软件包也许涉及自 NodeJS 12 以来似乎是新的
服务器在rails 3生产环境中找不到公用文件夹

我正在使用最新的 Rails 3 beta 该应用程序在开发模式下工作正常但是当我通过以下方式在生产模式下启动服务器时rails server e production 似乎public找不到文件夹我收到如下错误消息 ActionCon
在PHP中接收UDP数据包数据报

我正在用 php 为 GPS 跟踪系统构建监听服务器 GPS 通过 UDP 数据包发送数据我可以通过运行以下脚本来显示数据然而实际数据以符号形式出现所以我猜我错过了转换 Reduce errors error reporting E
以不同顺序遍历 3D 数组

我有一个 3D 节点数组我想通过从数组的中间节点开始并向角落移动来遍历它就像这样 and So on but for visualization purposes I ve shown in 2D but actually it is
swift xcode 从播放器列表中播放声音文件

我正在寻找一种快速编码可以从播放器列表中播放声音而不是将声音作为资源添加到您的项目中我主要找到了用法 NSURL fileURLWithPath NSBundle mainBundle pathForResource sound na
在ios中使用Quartz 2d进行注释（注释、评论）

我正在为 iPad 做基于 PDF 的应用程序它支持缩略图视图徒手注释和注释 Notes 我和我在网上搜索了很多但没有找到任何使用 Quartz 2d 在 PDF 上进行注释的相关答案我们可以使用以下方法获取 PDF 页面信息 CG
HID 兼容设备不会在 ChromeOS 上使用 chrome.hid API 进行枚举

使用 USB HID 传感器我似乎只能用chrome usb API https developer chrome com apps usb在 Chrome 操作系统上在 OS X 上我可以枚举chrome hid API https d
正则表达式删除每行开头的空格？

我想删除每行开头的空格我每行都有数据开头有一组空格因此数据出现在中间我想删除每行开头的空格 tmp tmp replace lt gt gt g 我怎样才能添加 s条件成那个replace 要删除所有前导空格 str str rep
从哪里开始使用 API [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我以前从未使用过 API 并且在 HTML 和 CSS 之外几乎没有编程经验并且我正在努力寻找任何清晰的教程或解释所有 API 的工作方
模拟函数调用实际函数

我有 cassandra python 驱动程序的代码 from cassandra cqlengine management import sync table def sync my tables print sync table pr
应该由 Promise 调用同步代码。然后创建一个新的 Promise

我已经实现了一些代码其中异步代码后面跟着一些同步函数例如 function processSomeAsyncData asyncFuncCall then syncFunction catch error 如果我理解正确的话then也是
套接字丢失数据

我正在尝试编写 Java 代码来从流式 HTTP 连接接收数据我想调试针对 spring websocket 服务器运行 Sockjs XHR 流时遇到的问题我使用一些非常简单的代码来连接 URI uri The server Sock
从 Android 中列表视图中放置的 EditText 获取值

我不知道如何获取列表视图中的编辑文本值位置我使用单工适配器用数据填充了列表视图有人会给出从列表中获取 edittext 值的示例代码吗 for int i 0 i lt ListSortOrder getAdapter getCount
C++ 返回一行

我正在编写一个多行系统如下所示 string readLines string x string temp a vector
如何在 FPDF 中设置下边距

我最近深入研究了 FPDF 但我似乎不明白的是为什么没有办法设置底部边距有一些功能可以设置顶部左侧和右侧的边距但不能设置底部的边距我现在假设我误解了 FPDF 工作原理的一些基本和概念性内容但我不知道那可能是什么所以要减少它
如何从 JavaFX 中的 SceneBuilder 访问 UI 组件

重复并已解决请参阅下面的答案我正在 JavaFX 中迈出第一步似乎很难使用 SceneBuilder 我已经习惯了 Android 和 QtCreator 在我看来访问 UI 组件要容易得多就像是findViewById R id
在 UI 中为控制器内的操作添加嵌套分组部分

动作分组中是否可以有小节我们目前使用基于控制器的区分来对功能进行分组但托管大量控制器并且可以使用进一步的嵌套换句话说我知道操作可以按以下方式分组排序但可以多次分组 c GroupActionsBy apiDesc gt apiD
如何使用 R 从需要 cookie 的 SSL 页面下载压缩文件

我正在尝试从 https 页面下载一个文件该页面需要按下我同意按钮然后存储 cookie 如果这个答案在某个地方很明显我很抱歉当我直接在 Chrome 中打开网页并单击我同意时文件开始自动下载我尝试复制这个例子 http

如何使用 R 从需要 cookie 的 SSL 页面下载压缩文件

如何使用 R 从需要 cookie 的 SSL 页面下载压缩文件 的相关文章

随机推荐

热门标签

如何使用 R 从需要 cookie 的 SSL 页面下载压缩文件的相关文章