我正在尝试将网址表放入data.frame
。在其他示例中,我发现以下代码有效:
library(XML)
library(RCurl)
theurl <- "https://es.finance.yahoo.com/q/cp?s=BEL20.BR"
tables <- readHTMLTable(theurl)
正如警告所示,该表似乎不是 XML
Warning message:
XML content does not seem to be XML: 'https://es.finance.yahoo.com/q/cp?s=BEL20.BR'
或者,getURLContent(theurl, ssl.verifypeer = FALSE, useragent = "R")
有效,但不知道如何提取表格。任何帮助,将不胜感激。
编辑:感谢@har07使用table <- readHTMLTable(getURLContent(theurl, ssl.verifypeer = FALSE, useragent = "R"))$ yfncsumtab
给出输出,但仍然需要过滤。
如果您使用,您可以获得该表getURL
获取文档内容。有时readHTMLTable
无法获取内容。在这些情况下,建议尝试getURL
> library(XML)
> library(RCurl)
> URL <- getURL("https://es.finance.yahoo.com/q/cp?s=BEL20.BR")
> rt <- readHTMLTable(URL, header = TRUE)
> rt
您可能需要调整header
争论,可能还有其他争论,但表格就在那里。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)