在 html 表格中查找包含特定图标的单元格

2024-02-09

我正在寻找可以告诉我特定图标驻留在 html 表的哪个单元格中的代码。这是我正在处理的内容：

u <- "http://www.transfermarkt.nl/lionel-messi/leistungsdaten/spieler/28003/saison/2014/plus/1"
doc <- rvest::html(u)
tab <- rvest::html_table(doc, fill = TRUE)[[6]]

“位置”栏。指定球员在场上的位置。其中一些有一个附加图标。我可以在页面上看到这些图标的存在，如下所示：

rvest::html_nodes(doc, ".kapitaenicon-table")

但这并没有告诉我它们在哪里。我希望我的代码返回该图标出现在表中“位置列”的第 2、10、11、27 行中。我怎样才能做到这一点？

多一点rvestXPath 魔法可以为您提供索引：

library(rvest)
library(magrittr)
library(XML)

pg <- html("http://www.transfermarkt.nl/lionel-messi/leistungsdaten/spieler/28003/saison/2014/plus/1")

pg %>% 
  html_nodes("table") %>% 
  extract2(6) %>% 
  html_nodes("tbody > tr") %>% 
  sapply(function(x) {
    length(xpathSApply(x, "./td[8]/span[@class='kapitaenicon-table icons_sprite']")) == 1
  }) %>% which

## [1]  2 10 11 27

获取第 6 个表，提取tr然后 s 查找第 8 个td与适当的span/class在里面。如果 XPath 搜索失败，它将返回一个空列表，因此您可以使用长度来确定哪些行具有td其中有图标，而没有图标。

This:

pg %>% 
  html_nodes(xpath="//table[6]/tbody/tr/td[8]") %>% 
  xmlSApply(xpathApply, "boolean(./span[@class='kapitaenicon-table icons_sprite'])") %>% 
  which

也有效，而且更紧（更快）。它使用 XPathboolean测试存在性的操作。如果您没有其他操作要在节点上执行，这会更方便。

这是一xml2版本，尽管我必须相信必须有更好的方法来做到这一点xml2:

library(xml2)
library(magrittr)

pg2 <- read_html("http://www.transfermarkt.nl/lionel-messi/leistungsdaten/spieler/28003/saison/2014/plus/1")
pg2 %>% 
  xml_find_all("//table[6]/tbody/tr/td[8]") %>% 
  as_list %>% 
  sapply(function(x) {
    inherits(try(xml_find_one(x, "./span"), silent=TRUE), "xml_node")
  }) %>% which

UPDATE

对于版本0.1.0.9000 of xml2我必须执行以下操作：

pg2 %>% xml_find_all("//table") %>% 
  as_list %>% 
  extract2(6) %>% 
  xml_find_all("./tbody/tr/td[8]") %>% 
  as_list %>% 
  sapply(function(x) {
    inherits(try(xml_find_one(x, "./span"), silent=TRUE), "xml_node")
  }) %>% which

情况不应该是这样，我已经提交了错误报告 https://github.com/hadley/xml2/issues/39.

Session info -------------------------------------------------------------------------
 setting  value                       
 version  R version 3.2.0 (2015-04-16)
 system   x86_64, darwin13.4.0        
 ui       RStudio (0.99.441)          
 language (EN)                        
 collate  en_US.UTF-8                 
 tz       America/New_York            

Packages -----------------------------------------------------------------------------
 package    * version date       source        
 curl       * 0.5     2015-02-01 CRAN (R 3.2.0)
 devtools   * 1.7.0   2015-01-17 CRAN (R 3.2.0)
 magrittr     1.5     2014-11-22 CRAN (R 3.2.0)
 Rcpp       * 0.11.5  2015-03-06 CRAN (R 3.2.0)
 rstudioapi * 0.3.1   2015-04-07 CRAN (R 3.2.0)
 xml2         0.1.0   2015-04-20 CRAN (R 3.2.0)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

rvest

在 html 表格中查找包含特定图标的单元格的相关文章

合并的 xts 对象未对齐

请尝试以下代码 library quantmod getSymbols SPY from 1950 01 01 SPY lt to monthly SPY temp lt xts Cl SPY index SPY 您将获得一个xts具有相同
如何对 lm() 中的一系列值进行子集化

lm 的帮助文件没有涉及子集参数的语法我不知道如何让它找到最适合我的数据集的一部分的线这个问题是类似的但我无法使用它解决我的特定问题子集参数在 lm 函数中如何工作 https stackoverflow com questions
删除第一次出现某个值后的行

我有以下 df df lt data frame var1 c 1 2 2 3 4 5 5 6 7 8 9 var2 c a b c d e f g h i j k 我想在达到前 5 var1 后进行过滤所以结果应该是 var1 var2
使用从变量中选择的列名称逐行索引数据框

考虑以下数据框 TEST lt structure list Value c NA NA NA NA NA NA NA NA NA NA NA NA Select structure c 2L 1L 3L 2L 2L 1L 1L 2L 1L
如何使用“NA”作为字符串

我有一个 csv 文件其中一列是字符类型该变量的很少有值是 NA 字符串但是当我使用 read csv 读取 R 中的 csv 文件时 NA 字符串存储为 NA 我该如何修复它您可以使用na strings论证中read csv r
R 和系统调用

我过去曾使用 R 对命令行进行非常基本的调用例子可以找到here https stackoverflow com questions 3284301 command line in r code 这一次我希望模仿这段从 Windows
使用 lapply、Reduce 和 union 折叠 data.table 中的行

我有一个 data table 示例 JACcar 它应该使用下面的代码根据 ID 折叠成一行但是我不明白为什么它不会折叠少于 2 行我还尝试通过将列限制为仅包含 NA 以外的值的列来验证我的输出因为原始数据中有 123 列有人可
基于两列对数据框中的行进行求和[重复]

这个问题在这里已经有答案了我想添加一列的值将它们按两列分组我找到了如何在一列上执行此操作但无法弄清楚如何在两列上执行此操作例如如果我有以下数据框 x c a a b b c c a a b b c c a a b b c c y
如何扩展 ggplot y 轴限制以包含最大值

通常在图中 Y 轴值标签会在绘制的最大值下方被截断 For example library tidyverse mtcars gt ggplot aes x mpg y hp geom point 我知道scale y continous
写入抓取数据的 csv 文件时如何拆分项目名称

我有兴趣使用 R 从网上抓取的数据创建 csv 或类似的 Excel 兼容文件到目前为止我通过执行以下操作来存储数据 require textreadr spiegel lt read html http www spiegel de
使用 r 以周为单位对数据进行分组

I have a CVS file which has data for different countries at different weeks of this year I want to create a summary data
获取数据集 R 包中所有对象名称的列表？

如何获取对象中对象的确切名称列表datasets https stat ethz ch R manual R devel library datasets html 00Index html包裹我在这里找到了很多 data package
如何通过在R闪亮循环中读取.csv文件来动态生成dataTableOutput？

我有一个函数可以生成 n 个数据帧并将其作为 csv 文件保存在某个位置并且该函数返回已保存 CSV 的文件名我希望获取这些 csv 文件使用以下命令读取它read csv 然后使用 renderUI 和 renderDataTabl
GitHub 操作 setup-r-dependency 失败，说明没有名为“digest”的包

我一直在尝试设置一些 GitHub 操作来自动检查我的 R 包并运行测试覆盖率我目前正在使用 setup r dependency v2 操作来安装依赖项但无法安装包 digest 返回以下错误 Error Error
将多个函数应用于一个向量

我正在寻找一种将多个函数应用于一个向量的选项我认为这对于逆应用函数来说是一种仁慈其中一个函数应用于许多向量或列有没有办法指定两个或多个函数例如 min 和 max 并将其应用于向量与 CathG的评论类似但没有get v lt
如何从数据框中按降序获取前n家公司

我正在尝试从数据框中获取排名前 n 的公司下面是我的代码 data Forbes2000 package HSAUR sort Forbes2000 profits decreasing TRUE 现在我想从这个排序向量中获取前 50 个
使用 xtable 对乳胶输出的表进行排序

我正在尝试生成一个排序表并导出到乳胶中然而 xtable 似乎无法处理排序表建议 a lt sample letters 500 replace T b lt table a c lt sort table a decreasing T
如何使用 Rrank() 函数创建新的ties.method？ [复制]

这个问题在这里已经有答案了我试图按人口和日期排序这个数据框所以我使用order and rank 功能 gt df lt data frame idgeoville c 5 8 4 3 4 5 8 8 date c rep 1950 4
do.call 的 envir 选项如何工作？

的文档do call states If quote is FALSE 默认值然后对参数进行求值在调用环境中而不是在envir 这句话向我暗示当quote FALSE 指定envir没有什么区别然而事实并非如此事实上我遇到过需
包什么时候需要为它自己的对象使用 :::

考虑这个 R 包有两个函数一个是导出函数另一个是内部函数 hello R export hello lt function internalFunctions hello internal 你好内部 R hello internal

随机推荐

有什么理由只传递第一个元素而不是整个数组？ [复制]

这个问题在这里已经有答案了好的昨天我有一位同事来到我的办公室问我一个关于他必须使用的 Fortran 代码的问题基本上他使用的代码有一个长的多维数组以及一个需要这个长的多维数组作为参数的子例程但是调用该子例程的代码仅传递数组
CSS 中缩放渐变背景

第一次提问请对我宽容一些我正在尝试为使用 JQuery Mobile 的网络应用程序制作背景渐变我对 CSS 和 UI 设计一无所知我希望渐变填充整个页面的空间现在它填充到原始窗口的大小但向下滚动时会切断大多数建议都指向这
如何在 Android Native Code 中使用 Keystore？

我需要加密由用 C 编写的 android 本机服务创建的一些文件我必须使用密钥库但我不知道如何使用有什么库或者文档吗我知道该线程很旧但也许它会对将来的某人有所帮助以下提示参考 Android Keystore v3 和 v4
javascript/dashcode：检查互联网连接

我正在开发一个通过ajax从互联网获取数据的小部件如果该小部件无法连接到服务器我想提供一条错误消息我正在使用 jquery 的 ajax 对象执行请求该对象提供了错误回调函数但是当没有互联网连接时仅当发出请求但因其他原因失败时才
AngularJS $http.post如何将json数据设置到请求正文中

我正在尝试将带有 json 数据的 post 请求发送到服务器但似乎 angularJS http post 方法没有将数据设置到正文中我怎样才能让它将数据设置到正文中远程服务器使用asp net webapi实现将从body中读取
webpack 中的 module、chunk、bundle 分别是什么？

我不太理解模块块和捆绑等概念 entry foo webpack hot only dev server js src foo js bar src bar js output path dist filename name js 上述配
插入忽略 - 有没有办法知道语句是否被忽略？ MYSQL [重复]

这个问题在这里已经有答案了 sql insert INSERT IGNORE if mysql query sql insert link or die Insertion Failed mysql error code to execut
Bash，eval 中的 CTRL+C 不会中断主脚本

在我的 bash 脚本中我正在运行存储在中的外部命令 cmd多变的它可以是任何东西甚至是一些简单的 bash oneliner If ctrl C is pressed while running the script I want
ACF 字段未显示在 WordPress 自定义分类页面上

我在自定义分类页面上显示 ACF 时遇到问题自定义税是目的地页面为taxomony destinations php 该字段称为 destination landing image 我试图将其显示在 mysite com destin
我可以在 JSP 中生成新线程吗？

我需要从 JSP 创建一个新线程在 JSP 中生成线程是个好主意吗有没有其他方法 It is 绝对不在 JSP Servlet Web 应用程序中手动生成非托管线程是一个好主意当然不是在 JSP 端完成因为它在任何方面都不符合 JS
如何为非 root 基本 url 设置 AngularJS $locationProvider HTML5 模式？

我有一个正在运行的 AngularJS 1 3 8 应用程序它在 Tomcat 中的应用程序上下文 app 下部署为 Web 应用程序网址如下所示 https www myserver com app login https www m
为什么 ASP.NET MVC 中的超时时间很短？

我有一个 MVC 2 应用程序其中超时设置为 2880 据我所知是分钟但即使是秒也有问题
matplotlib：拉伸图像以覆盖整个图形

我已经习惯了使用 matlab 现在正在尝试转变 matplotlib 和 numpy matplotlib 中有没有办法让您正在绘制的图像占据整个图形窗口 import numpy as np import matplotlib pypl
Keras 自定义层 2D 输入 -> 2D 输出

我有一个 2D 输入如果考虑样本数量则为 3D 我想应用一个 keras 层来获取此输入并输出另一个 2D 矩阵因此例如如果我有一个大小为 ExV 的输入则学习权重矩阵将为 SxE 和输出 SxV 我可以用密集层做到这一点吗 E
使用自动完成的值填充状态（反应）

我有一个带有输入字段和一个按钮的组件除非在输入字段中输入正确的值否则该组件将被禁用这工作正常但是当 chrome 在页面加载时自动完成这些值时状态不会改变因此按钮保持禁用状态如果您在表单内单击或更改值状态会正确更改组件加载
在 DynamoDB 中查找平均值和总和？

如何获得 packSOC 和totalKw 的总和和平均值我使用 dynamoDB 作为数据库但据我了解 dynamoDB 不支持聚合如何获得 packSOC 和totalKw 的平均值和总和不可能在结果上使用for 循环因为结果
Spring boot 属性值从 String 到 Duration 的转换在应用程序中有效，但在单元测试中失败

根据春季文档 https docs spring io spring boot docs 2 1 8 RELEASE reference html boot features external config html boot featur
使用 Google Maps API v3 在服务器端检查多边形区域内是否存在点

逻辑是用户正在编辑一个现有的多边形区域其极值点存储在数据库中编辑后修改后的坐标将在数据库中更新现在我需要查找修改后的多边形内是否存在某个点为此我假设我必须进行服务器端检查客户端检查可以通过 javaScript 轻松完成我
编写 Perl CGI 应用程序的最佳方法是什么？

我见过的每个 CGI Perl 示例基本上都是一堆包含 HTML 的打印语句这似乎不是编写 CGI 应用程序的最佳方法有一个更好的方法吗谢谢编辑我决定使用 CGI Application 和 HTML Template 并使用以下
在 html 表格中查找包含特定图标的单元格

我正在寻找可以告诉我特定图标驻留在 html 表的哪个单元格中的代码这是我正在处理的内容 u lt http www transfermarkt nl lionel messi leistungsdaten spieler 28003 s

在 html 表格中查找包含特定图标的单元格

在 html 表格中查找包含特定图标的单元格 的相关文章

随机推荐

热门标签

在 html 表格中查找包含特定图标的单元格的相关文章