Rvest html_nodes span div 和 Xpath

2024-03-01

我正在尝试通过阅读 XPath 代码来抓取网站。当我进入开发人员部分时，我看到这些行：

<span class="js-bestRate-show" data-crid="11232895" data-id="928723" data-abc="0602524361510" data-referecenceta="44205406" data-catalog="1">

我想抓取 data-abc 的所有值。假设网站上的每个元素都是一部电影，所以我想抓取页面上每部电影的所有 data-abc 元素。

我想使用 Rvest 包和 R 来实现这一点。以下是两种不同的尝试，但均无效...

website %>% html_nodes("js-bestRate-show") %>% html_text()

website %>%
  html_nodes(xpath = "js-bestRate-show") %>%
  html_nodes(xpath = "//div") %>%
  html_nodes(xpath = "//span") %>%
  html_nodes(xpath = "//data-abc")

有人知道 html_nodes 和 Rvest 是如何工作的吗？

该节点是span与类js-bestRate-show。其他一切都是属性。所以你想要这样的东西：

library(rvest)
h <- '<span class="js-bestRate-show" data-crid="11232895" data-id="928723" data-abc="0602524361510" data-referecenceta="44205406" data-catalog="1">'

h %>% 
  read_html() %>% 
  html_nodes("span.js-bestRate-show") %>% 
  html_attr("data-abc")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

xpath

rvest

Rvest html_nodes span div 和 Xpath 的相关文章

将列表中的每个元素转换为数据框中的一列

假设我有以下列表 d library combinat d permn c a b c 这看起来如下 1 1 a b c 2 1 a c b 3 1 c a b 4 1 c b a 5 1 b c a 6 1 b a c 是否可以将此列表的
我可以使用哪个 R 函数来查找两条线的交点？

我刚刚研究了 stackoverflow 上所有的在 R 中寻找交集问题它们要么是关于曲线要么是关于分布像这个 https stackoverflow com questions 20519431 finding point of
如何在 R 中的 for 循环内将值存储在向量中

我正在开始使用 R 但我对以下问题感到非常沮丧我试图将 for 循环内完成的某些计算的值存储到我之前定义的向量中问题是如何进行索引因为for循环迭代代码的次数取决于用户的输入所以变量i不一定要从1开始它可以从80开始 for举个例
如何使用XPath选择非空段落？

我想要抓取的网页具有类似的结构每个都有一个段落是一个问题一个段落是一个答案我想抓取每个问题和答案并将它们存储在两个项目中问题是在某些页面上问题和答案分别是 xxx p 1 and xxx p 2 但在其他页面上 xxx p 1
更新 R6 对象实例中的方法定义

如何更新 R6 类实例的方法定义正如我所期望的 S3 使用当前的方法定义对于 R5 参考类我可以使用 myInstance myInstance copy 在 R6 中我尝试了 myInstance myInstance clone
在 RcppArmadillo 中将列向量乘以数值标量

我在编译这个简单的程序时遇到一些麻烦c 代码使用Rcpp和RcppArmadillo包裹采用以下简单示例将矩阵的每一列乘以数值标量 code lt arma mat out Rcpp as
在 Shiny 中显示反应式 htmlTable 表格

我正在制作我的第一个 Shiny 应用程序但找不到任何有关如何显示使用 htmlTable 包创建的表格的示例我基本上想在按下按钮时创建一个表格并显示它 Shiny 显示 html 代码而不是表格我不知道用什么替换服务器部分中的 re
在 RMarkdown 输出到 PDF 时缩进而不添加项目符号点或编号

之前有人问过如何在没有项目符号的情况下缩进文本 RMarkdown 中的点但这是针对 HTML 输出的在 RMarkdown 中缩进而不添加项目符号点或数字 https stackoverflow com questions 47087
使用选定因子水平的值向 ggplot-barchart 添加水平线

在这个情节中 df lt data frame factor as factor c rep A 3 rep B 3 Treatment c rep c A B C 2 values runif 6 0 1 ggplot df aes Tr
ggplot：如何限制条形图中的输出，以便仅显示最频繁出现的情况？

我几个小时以来一直在寻找这个简单的东西但没有结果我有一个数据框其中一列为变量国家地区我想要两件事以下绘制最常见的国家地区最常见的位于顶部找到部分解决方案EDIT找到完整的解决方案 gt gt 重点问题是根据频率限制条形图
如何动态地将 sliderInput 添加到闪亮的应用程序中？

使用闪亮我上传一个 csv 文件并根据列名称我需要向 ui 添加滑块 sidebarPanel fileInput file1 Upload CSV File to Create a Model accept c text csv t
自定义轴缩放后 ggplot2 缺少标签

我正在尝试使用我的 x 轴应用自定义缩放ggplot2 and scales trans new 但是当我这样做时一些轴标签丢失了有人可以帮我弄清楚为什么吗 Setup library tidyverse the data ds lt
如何使用 selenium 和 Mocha 获取 xPath() 选择的锚标记的文本

我已经成功选择了 a 标签我想显示锚标记的文本但无法这样做我正在使用 selenium mocha javascript 和 phantomJS 这是我的脚本详细 var assert require assert var test
更改 R 中 ggplot geom_polygon 的颜色方案

我正在使用地图库和 ggplot 的 geom polygon 创建地图我只是想将默认的蓝色红色紫色配色方案更改为其他颜色我对 ggplot 非常陌生所以如果我没有使用正确的数据类型请原谅我使用的数据如下所示 gt head
R 数据结构的运算效率

我想知道是否有任何关于操作效率的文档R 特别是那些与数据操作相关的例如我认为向数据框添加列是有效的因为我猜您只是向链接列表添加一个元素我想添加行会更慢因为向量保存在数组中C level你必须分配一个新的长度数组n 1并将所有元素复
在 RGL 中将立方体绘制到 3D 散点图中

我正在尝试向 3D 散点图添加较小的立方体网格具有指定边长我希望立方体位于原点我该怎么做呢我已经玩过cube3d 但我似乎无法将立方体正确定位也无法使其成为网格因此我可以看到它包含的数据点这是我所拥有的 library rg
安装 2.15 后 ggplot2 中的 alpha 通道不起作用

更新到 R 2 15 后 ggplot 中的 alpha 通道似乎不再起作用 plot rnorm 100 rnorm 100 bg cc000055 pch 21 工作得很好但是 qplot rnorm 100 rnorm 100 col
如何在R中分离两个图？

每当我运行这段代码时第一个图就会简单地覆盖前一个图 R中有没有办法分开得到两个图 plot pc title main abc xlab xx ylab yy plot pcs title main sdf xlab sdf ylab x
更改ggplot2中的字体

曾几何时我改变了我的ggplot2字体使用windowsFonts Times windowsFont TT Times New Roman 现在我无法摆脱这一切在尝试设置family in ggplot2 theme 当我用不同的字
如何使用plotmath更新ggplot图例标签

我正在尝试更新ggplot要使用的图例标签plotmath但是当我这样做时它将之前组合的图例分成两部分通过一个例子可能更容易理解 test data and the default plot gives the correct col

随机推荐

位置：固定和宽度：继承百分比父级

我想给一个fixed元素awidth百分比父母这里 container 当我使用像素而不是百分比时它就起作用了我该怎么做这可能吗 CSS HTML div div div Sitename div div div CSS outer
可以省略不必要的启动图像吗？

我有一个仅支持运行 iOS 10 或更高版本的 iPhone 的应用程序我只添加了以下图像电子邮件受保护 cdn cgi l email protection 电子邮件受保护 cdn cgi l email protection 电子邮
JUnit 测试 if else case

如何将测试写入当前方法我使用 jUnit 4 public void setImage if conditionOne myView setImageOne else myView setImageTwo 好的您编写此方法的方式存在缺陷
忽略排队的鼠标事件

我有一个用 C 编写的针对 NET Compact Framework 3 5 的应用程序在 Windows CE 上运行有时会在 UI 线程上执行持续一秒左右的操作我目前设置的是Cursor Current属性来指示应用程序正忙
在 Windows 命令终端中启动 R

我不知道如何在 Windows 命令终端中启动 R 我跑cmd键入后打开命令提示符R rcmd start R并尝试我发现的其他可能性但我有一个错误 R is not recognized as an internal or extern
架构arm64解析的未定义符号

我正在尝试在我的应用程序中实现解析这里的问题是我收到这些奇怪的错误我不知道它们的含义我尝试过 1 更改架构但最新版本的Xcode不允许我设置自己的架构例如arm64 2 我尝试删除可能有冲突的 SDK Dropbox 3 我已经链
有选择地恢复或签出 Git 中文件的更改？

是否有命令允许您部分撤消对工作目录中一个或多个文件的更改假设您对一个文件进行了多次编辑但您意识到想要将某些更改撤消回已提交状态但不想将其他更改撤消我正在设想一个选项git checkout这很像git add p 即它会逐个检查文件
从 pandas 数据帧的列中提取主题标签

我有一个数据框df 我想从 Max 45 的推文中提取主题标签 Max Tweets 42 via VIE unlike at fashion 42 Ny trailer katamaritribute ps3 45 Saved a bab
检查路径是否会因 open_basedir 而失败

是否可以在失败之前检查一下 if is in open basedir path 您可以使用ini get http php net manual en function ini get php获取 open basedir 的当前值以检查
仅当表中尚不存在记录时插入记录

我想知道是否有办法仅在表尚未包含该记录时才将记录插入表中是否有一个查询可以执行此操作或者我需要一个存储过程你没有说 SQL Server 是什么版本如果 SQL Server 2008 你可以使用MERGE http technet
如何制作 PHP SOAP 客户端并将结果 xml 存储在 php 变量中

我正在使用 PHP 以前从未使用过 SOAP 和 PHP 我需要建立Soap PHP 客户端它正在调用并从 a 检索信息Soap 服务器 NET Web 服务我目前正在努力获取信息荷兰医疗保健系统的医生对于在荷兰医疗保健系统中注册的每位
错误 LNK2001：无法解析的外部符号“public：静态类 sf::RenderStates const sf::RenderStates::Default”

这是代码 Engine h include
Symfony 3.4 和 Fixtures Bundle 捆绑版本 3.0 存在问题

我正在尝试从以下位置配置捆绑包 https symfony com doc master bundles DoctrineFixturesBundle index html https symfony com doc master bund
如何在启动器图标中添加类似像素的活动快捷方式？

Since the release of pixel series there has been this feature to add activity shortcuts in application icon itself by lo
替换 node.js 中文本文件中的字符串

我正在使用node js 我想读取带有一些占位符字符串的文件并在提供文件之前动态替换它们这不是 HTML 文件因此模板引擎将无法工作我怎样才能做到这一点如果模板引擎太过分了就使用string replace temp Hello
用不同版本的 pandas 读取 pickle

我无法读取使用不同版本的 Python pandas 保存的 pickle 文件我知道以前曾在这里问过这个问题但是提供的解决方案使用pd read pickle my file pkl 也不工作我认为但我不确定这些 pickle
r 中的“部分”枢轴宽

我有一个如下所示的数据框 Time Y 1 2 1 3 1 2 2 5 2 7 2 5 3 10 3 9 3 8 我想创造一些看起来像 Time R1 R2 R3 1 2 3 2 2 5 7 5 3 10 9 8 我必须保留时间列以进行进一
gccgo 上的精确

当尝试在 Precise 上与 gccgo 链接时出现以下链接错误 matt matt 1005P src gopath src meme gccgo cmd meme main go o meme usr bin ld cannot f
通过函数传递表达式

我在用着data table包并尝试编写一个函数如下所示 require data table Function definition f function path key table data table read delim pat
Rvest html_nodes span div 和 Xpath

我正在尝试通过阅读 XPath 代码来抓取网站当我进入开发人员部分时我看到这些行 span class js bestRate show 我想抓取 data abc 的所有值假设网站上的每个元素都是一部电影所以我想抓取页面上每部电影

Rvest html_nodes span div 和 Xpath

Rvest html_nodes span div 和 Xpath 的相关文章

随机推荐

热门标签