我想使用 R 中的 URL 保存 HTML 文件。
我尝试在使用后保存响应对象GET
and read_html
的功能httr
and rvest
分别打包到网站的 URL 上,我想保存 的 HTML。但这并不能保存网站的实际内容。
url = "https://facebook.com"
get_object = httr::GET(url); save(get_object, "file.html")
html_object = rvest::read_html(url); save(html_object, "file.html")
这些都无法将实际网站的正确输出(即 .html 文件中的网页的 HTML 内容)保存在 HTML 文件中。
Use str(object)
弄清楚你正在做什么。在这两种情况下,您都试图将非文本写入文本文件。
以下是如何获取文本并使用两个库编写它......
url = "https://facebook.com"
library(httr)
get_object = GET(url)
cat(content(get_object, "text"), file="temp.html")
library(rvest)
html_object = read_html(url)
write_xml(html_object, file="temp.html")
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)