将 xls 文件从 url 下载到数据框（Rcurl）中？

2023-12-10

我正在尝试将以下网址下载到 R 数据框中：

http://www.fantasypros.com/nfl/rankings/qb.php/?export=xls

（这是公共页面上的“导出”链接：http://www.fantasypros.com/nfl/rankings/qb.php/)

但是，我不确定如何“解析”数据？我还希望将其自动化并每周执行一次，因此任何有关如何将其构建为每周访问工作流程的想法将不胜感激！已经在 google 搜索和 stackoverflow 上搜索了几个小时了，但没有结果......:-)

谢谢你，

Justin

尝试的代码：

getURL("http://www.fantasypros.com/nfl/rankings/qb.php?export=xls")

这只是给了我一个开头如下的字符串：

[1] "FantasyPros.com \t \nWeek 8 - QB Rankings \t \nExpert Consensus Rankings (ECR) \t \n\n Rank \t Player Name \tTeam \t Matchup \tBest Rank \t Worst Rank \t Ave Rank \t Std Dev \t\n1\tPeyton Manning\tDEN\t vs. WAS\t1\t5\t1.2105263157895\t0.58877509625419\t\t\n2\tDrew Brees\tNO\t vs. BUF\t1\t7\t2.6287878787879\t1.0899353819483\t\t\n3\tA...

欢迎来到R。听起来您喜欢在 Excel 中进行分析。这完全没问题，但事实上，您要求从网络上抓取数据并询问 R，我认为可以安全地假设您将开始找到对分析进行编程的方法。

也就是说，您真正想做的是抓取网络。有大量关于如何使用 R 执行此操作的示例，就在 SO 上。查找诸如“网页抓取”、“爬行”和“屏幕抓取”之类的内容。

好吧，抛开对话不谈。不用担心抓取 XL 格式的数据。您可以直接使用 R 解析数据。大多数网站都使用一致的命名约定，因此使用for循环并为数据集构建 URL 将会很容易。

下面是直接使用 R 将页面解析为data.frame其作用与 EXCEL 中的表格数据非常相似。

## load the packages you will need
# install.packages("XML")
library(XML)

## Define the URL -- you could dynamically build this
URL = "http://www.fantasypros.com/nfl/rankings/qb.php"

## Read the tables form the page into R
tables = readHTMLTable(URL)

## how many do we have
length(tables)

## look at the first one
tables[1]
## thats not it

## lets look at the 2nd table
tables[2]

## bring it into a dataframe
df = as.data.frame(tables[2])

如果您正在使用R第一次，您可以使用以下命令轻松安装外部软件包install.packages("PackageNameHere")。但是，如果您认真学习 R，我会考虑使用 RStudio IDE。它确实在很多层面上使我的学习曲线变得平坦。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将 xls 文件从 url 下载到数据框（Rcurl）中？的相关文章

如何在 R 地图库中绘制正确的颜色

我正在尝试使用 R 地图库为特定国家绘制特定颜色我可以填写颜色但它们与各自的国家地区没有正确关联我想知道是否有人能知道为什么我的数据框是 filld 有 3 列第一列是国家名称第二列只是一些数字数据第三列是颜色 countr
我可以调整scale_color_brewer的下限吗？

我已经订购了我想使用 color Brewer 的分类数据但我很难看到非常低的值有没有办法去掉这些较低的值或设置范围的下限 ggplot data frame x 1 6 y 10 15 w letters 1 6 aes x y co
如何在 Shiny 中动态渲染的 textInput 添加样式元素

你好堆栈溢出在我最近提出的问题中我已经解决了一些与动态渲染 UI 元素相关的主要问题并在一些了不起的人的帮助下动态创建了观察者参见此处动态渲染的 UI 如何在第二次运行时删除旧的反应变量 https stackoverflow c
R 中带有边缘箱线图的直方图

如何使直方图中的 X 轴与边缘箱线图匹配 data lt rnorm 1000 nf lt layout mat matrix c 1 2 2 1 byrow TRUE height c 1 3 layout show nf par mar
使用亚毫秒日期时间从字符->POSIXct->字符准确转换

我的文件中有一个字符日期时间列我加载文件到data table 并执行需要将列转换为的操作POSIXct 然后我需要写POSIXct值返回文件但日期时间不会相同因为打印不正确这个打印格式问题是众所周知的并且已经被讨论过多次我
通过 RCpp 返回 NA

新手 RCpp 问题在这里 How can I make a NumericVector returnNA到R 例如假设我有一个 RCpp 代码它分配NA到向量的第一个元素 RCpp export NumericVector myFun
求解非线性方程组

我正在尝试求解以下四个方程组我尝试过使用 rootSolve 包但似乎我无法通过这种方式找到解决方案我正在使用的代码如下 model lt function x F1 lt sqrt x 1 2 x 3 2 1 F2 lt sqrt
R 在安装包依赖项时不考虑最大版本

假设我正在开发一个名为magicr做一些统计魔术我希望它使用另一个名为的包中的函数fairydust 假设存在于 CRAN 上很遗憾fairydust刚刚向 CRAN 发布了 2 0 0 版本完全破坏了我计划使用的功能所以我更新了
用plotly创建丝带

我需要在散点图上绘制加速度与英里加仑的两个斜率轻型汽车一处斜坡重型汽车一处斜坡我创建了这个 cars light lt cars log cars log log weight lt log mean cars weight car
R 中的线性模型 - 乘法表达式

我有 3 个数值变量A B and C 我正在尝试创建一个能够预测的线性模型A 我使用的表达式是B C为了预测A 然而当查看输出时我无法得到我的方程因为我得到了额外的变量但我不知道它是什么这是我的代码 MyData lt read
R：行数不相等的列绑定

我有两个数据集它们每个都有变量 ID Block 和 RT 反应时间我想合并列绑定这两个集合以便我拥有一个包含变量的数据集 ID 块 RT1 RT2 问题是两个集合中的行数不相等此外 ID 和块号匹配也很重要缺失值应替换为 NA
R 的 read.csv 在第一列名称前面加上垃圾文本[重复]

这个问题在这里已经有答案了我已将数据从 SQL Server Management Studio 中的结果网格导出到 csv 文件 csv 文件看起来正确但是当我使用 read csv 将数据读入 R 数据帧时第一个列名称前面带有如
在 Rlattice xyplot 上分别控制轴刻度和轴线

我怎样才能去除周围的盒子xyplot 同时保留轴刻度刻度线本着爱德华塔夫特 Edward Tufte 极简主义数据图形美学的精神这些轴线是非数据墨水并且可以应该被擦除 library lattice my df lt dat
如何强制在较新版本的 R 上安装较旧的软件包？

我无法安装proj4string进入我当前版本的 R 2 15 1 Warning message package proj4string is not available for R version 2 15 1 我认为这是因为 2 15
在r中拆分数据并将所有拆分文件保存在csv中

我有一个名为 data 的数据集 Model Garage City Honda C Chicago Maruti B Boston Porsche A New York Honda B Chicago Honda C New York 它
如何在 R 中为所有plot.default、plot 或lines 调用设置默认颜色

为了简化我的日常 R 交互我想为所有绘图设置默认颜色例如假设我想要用红线绘制所有绘图例如在 gnuplot 中到目前为止这是我的 Rprofile 的片段 setHook packageEvent grDevices onLoa
ggplot2 - 在绘图顶部添加辅助 y 轴

对于出版物我需要向现有绘图添加第二个 y 轴我遇到了一种方法来做到这一点 https rpubs com kohske dual axis in ggplot2 https rpubs com kohske dual axis in g
将其他数据集的点添加到ggplot2

关于这个主题已经有很多问题但我找不到能回答我的具体问题的问题我有一个barplot see testplot1 and testplot3如下绘制数据集 bardata如下并希望从另一个数据集向其添加点 pointdata 请参阅简
geom_polygon 的渐变填充

此代码生成一个包含 3 个多边形的图表我正在创建一个显示 3 个多边形的图表如果有更好的方法来绘制多边形我不太感兴趣实际上这些多边形代表事件并且这些事件有一个持续时间首先我感兴趣的是使用渐变填充每个多边形的可能性 librar
为什么在 data.frame 中预先指定类型会比较慢？

我预先分配了一个大 data frame 以便稍后填写我通常这样做NA是这样的 n lt 1e6 a lt data frame c1 1 n c2 NA c3 NA 我想知道如果我预先指定数据类型是否会让事情变得更快所以我测试了 f1

随机推荐

gdb无法调用函数

我在调试我的应用程序时遇到一些问题当我尝试从 gdb shell 调用 parser extractString 时它返回名称空间 parser 中没有符号 extractString 当我执行时信息函数 extractString
Java slick，html找不到AppletLoader

我使用基于 slick 状态的游戏制作了一个 java 游戏因为我的游戏扩展了 StatBasedGame 它不是一个真正的小程序因为它不扩展 JApplet 所以为了解决这个问题有一个使用 slick 内置的方法可以在 html
java.sql.SQLException: ORA-00936: 缺少表达式

下面我正在创建表格 public static final String CREATE SQL CREATE TABLE DATABASE TABLE ID number 10 0 CGUID VARCHAR 255 PGUID VARCH
自动压缩mongodb中删除的空间？

mongodb文档说要压缩此空间请从 mongo shell 运行 db repairDatabase 请注意此操作会阻塞并且速度很慢 in http www mongodb org display DOCS Excessive Di
为什么 Task.WhenAll 上的等待不抛出 AggregateException？

在此代码中 private async void button1 Click object sender EventArgs e try await Task WhenAll DoLongThingAsyncEx1 DoLongThingA
最大填充袋子的算法（这不是背包0/1）

我正在处理一些任务需要我解决以下算法问题 You Have collection of items their weights w1 w2 wn And You have a bag which weight is W It is Nee
将值从一个脚本返回到另一脚本

我有以下脚本将顺序运行目录中的每个脚本 import os directory for dirpath dirnames filenames in os walk path to scripts for filename in f fo
不使用 Invoke-Expression 扩展字符串

想象一下下面的代码 Script Start WelcomeMessage Hello UserName today is Date DayOfWeek 100 lines of other functions and what not f
MATLAB/Octave：从图像中切出很多圆圈

我有一个矩阵图像和有关圆圈内有趣部分的信息给出中心坐标和半径我想剪掉所有的圆矩阵的一部分以便对每个圆进行更多计算或者至少我想要一个带有所有圆圈的位掩码我使用 Octave 但也可以使用 MATLAB 但由于许可证问题这会很
验证失败，但无法在 DataGridView 中删除

这是我的 DataGridView 的 RowValidation 函数 DataGridViewRow row viewApplications Rows e RowIndex if row Cells colApplyTo Index
如何从两个 Openshift 应用程序访问 MongoDB 数据库？

我希望能够从 2 个 Openshift 应用程序访问我的 MongoDB 数据库一个应用程序是通过浏览器的交互式数据库维护应用程序另一个是通过 Openshift 应用程序在移动设备上运行的主要 Web 应用程序正如我在 Opens
通过 Java lib Apache Commons 上传文件的简明示例

编辑我已经删除了我的复杂且严重畸形的问题这样它就不会影响下面非常简洁和正确的答案考虑到找到一个在线示例来完成这项极其常见的任务非常困难令人惊讶我希望 Yoni 的回答能得到更多支持所以简而言之这个问题如何使用 Apache
Firebase 已获得 FedRAMP 授权？

我使用 Firebase 作为后端我看到谷歌服务已获得FedRAMP授权并且firebase已与谷歌云集成使用那么firebase也获得了FedRAMP的授权吗如果没有有什么办法可以在firebase中获得FedRAMP授权吗 T
使用 PHPExcel 从 Excel 读取数字时出现问题

我正在尝试使用 PHPExcel 从 Excelsheet 中读取数字我读取数据的代码 objReader PHPExcel IOFactory createReaderForFile upload file objReader PHPE
带原始数据的 Volley 请求

在我的应用程序中我必须使用 JSON req param 发送 POST 请求我尝试使用 Postman Rest Client 创建请求它工作正常但无法使用下面的代码在作为原始数据发送的 Postman req 参数中但我不确
R XML 解析网址

我正在尝试下载天气数据类似于此处提出的问题如何将XML解析为R数据帧但是当我运行示例中的第一行时我收到错误 1 无法加载 HTTP 资源我已检查该 URL 是否有效这是我指的行 data lt xmlParse http for
如何确定目录中的任何文件是否已更改

Chef 有没有办法确定它是否更改了给定目录中的任何文件如果conf d 目录中的任何设置被更新我想重新启动服务器进程我确信可以在每次厨师客户端运行时将 md5sum 列表写入文件并将当前迭代与之前的迭代进行比较但这是解决常见场景
错误 DEP0001：意外错误：-2147009287 部署 Windows Phone Universal 10

当我尝试将应用程序部署到 Windows Phone 10 时出现以下错误错误 2147009287 来自 Visual Studio 2015 社区我该如何解决这个问题正如 Jay Zuo 在他的评论中所说通过链接解决此问题的
使用 Gradle 编译项目时 IntelliJ 到底在做什么？

IntelliJ IDEA 2016 3 添加了将构建运行委托给 Gradle 的功能很明显当 Gradle 上有委托选项时 Gradle 就会执行所有操作我的问题是当此选项关闭时 IntelliJ 到底在做什么我问这个问题是因
将 xls 文件从 url 下载到数据框（Rcurl）中？

我正在尝试将以下网址下载到 R 数据框中 http www fantasypros com nfl rankings qb php export xls 这是公共页面上的导出链接 http www fantasypros com nfl

将 xls 文件从 url 下载到数据框（Rcurl）中？

将 xls 文件从 url 下载到数据框（Rcurl）中？ 的相关文章

随机推荐

热门标签

将 xls 文件从 url 下载到数据框（Rcurl）中？的相关文章