R 不接受 xpath 查询

2023-12-28

您好,我正在使用 R 中的 XML 包来抓取 html 页面。感兴趣的页面是http://www.ncbi.nlm.nih.gov/ Protein/225903367?report=fasta http://www.ncbi.nlm.nih.gov/protein/225903367?report=fasta在该页面上有一个序列,当检查 chrome 中的元素时,xpath 是

//*[@id="gi_225903367_141"]

但是当我尝试使用以下方法拉取它时:

xpathSApply(htmlParse(fasta.url.content),"//*[@id="viewercontent1"]/pre")
Error: unexpected symbol in "xpathSApply(htmlParse(fasta.url.content),"//*[@id="viewercontent1"

我收到上述错误。

XML 包是否对 xpath 很挑剔?

这是使用 Mathius 提供的 xpath 的查询

xpathSApply(htmlParse(fasta.url.content),"//span[contains(@id,'gi_225903367_1')]")
list()
attr(,"class")
[1] "XMLNodeSet"

我得到一个空列表。我不怀疑 xpath 是不正确的,但我想知道这是否与 R 相关。


问题是页面是使用 javascript 动态创建的,并且序列在返回到 R 的渲染中不可见。

CRAN 包“rentrez”提供了一个接口eutils http://www.ncbi.nlm.nih.gov/books/NBK25501/,这是查询 Entrez 的编程方式

library(rentrez)
entrez_fetch(db="protein", id="225903367", rettype="fasta")
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R 不接受 xpath 查询 的相关文章

随机推荐

  • 使用 django-tables2 时是否可以将模板标签应用于 ?

    我正在使用 django tables2 为我创建表 我需要将模板标签应用于其中一列中的每个单元格 仅仅为了将模板标签应用到一列 就需要花费大量额外的精力来创建自定义表格布局 有没有办法在 django tables2 中做到这一点 Upd
  • Spark 应用程序中的垃圾收集时间非常长,导致程序停止

    我正在本地模式下运行 Spark 应用程序 我正在使用 Spark 1 5 2 和 scala 2 10 4 当我使用大型数据集作为输入 我不断在日志中收到以下消息 16 01 04 14 44 12 INFO collection Ext
  • 不可终止的 Oracle 会话正在等待“来自客户端的 SQL*Net 消息”事件

    在 Oracle 11gR2 上 我最近遇到了一个非常有趣的情况 涉及阻塞 但空闲 MERGE挂在 a 上的声明 来自客户端的 SQL Net 消息 事件 导致后续并发执行MERGE通过以下方式阻止第一个语句的语句 光标 引脚 S 等待 X
  • 将多个 xdebug 覆盖率结果整理到一份报告中?

    我正在使用php 代码覆盖率 https github com sebastianbergmann php code coverage从一个 HTTP 请求 通过 apache 收集覆盖率信息 我想存储来自多个请求的覆盖率数据 然后将结果整
  • Facebook 2014:如何创建一个带有 iframe 的简单页面?

    我看过大量的指南和 YouTube 教程 但似乎很难创建一个简单的空页面 其中包含一个链接到另一个网站的 Iframe 你知道该怎么做吗 我需要这样的东西 https www facebook com betfred app 3368396
  • 在Heroku应用程序下挂载S3文件夹

    是否有这样的概念 在 Heroku 应用程序下 安装 资产文件夹 然后将其链接到 S3 存储桶 我有一个带有 公共 资产文件夹的节点应用程序 我想 slugignore 本地项目上的 public 文件夹 将 grunt 上传到 s3 存储
  • Mysql:如何选择具有特定值的组?

    假设有这样一个表 mysql gt SELECT FROM tags post id tag id 1 2 1 3 1 1 2 1 2 2 5 rows in set 0 00 sec 字段名称非常不言自明 我想选择post id同时具有
  • 在 mysqli 准备好的语句中使用 null

    在 mysqli 准备好的语句中 NULL 被转换为 对于字符串 或 0 对于整数 我想将它存储为真正的 NULL 有什么办法可以做到这一点吗 可以将 true NULL 值绑定到准备好的语句 读取this http www php net
  • jquery:反转顺序

    如何使用 jquery 反转订单 我尝试了这样的建议 但行不通 block item get reverse each function 看一看here http jsfiddle net BhTEN 我希望盒子能像这样重新排列 18 17
  • 根据某些匹配隐藏某些按钮

    如果符合以下规则 是否可以隐藏某些按钮 以下是用于创建按钮列的代码和用于获取匹配项的代码 我尝试过 BookButtonCell Visible false 但它说它只是只读的 Thanks private void Form1 Load
  • 实体框架查询多个集合

    我的上下文标记为 this Configuration LazyLoadingEnabled false 我想加载选定的相关实体 例子如 context Entry catalog Collection p gt p Products Qu
  • 如何使for循环在无法达到预定数量时返回填充行?

    我正在刮n来自 a b c d 源的相同类型数据的迭代 但有时这些数据源之一将返回小于n值 因为它没有太多可以提取的值 例如我将设置limit 5 but c将只有 3 个值可供抓取 问题是我通过跳过每个列表来组织返回的数据nth 值 因此
  • 因素数据框:将列分成两部分并提取数字

    我有以下数据框 df 下面是我在数据框中的第一列df 1 Well and Depth Black Peak 1000 Black Peak 1001 Black Peak 1002 Black Peak 1003 RStudio 目前将此
  • 在 Playground 中处理实时照片

    我已经在网络上进行了大量搜索 但我目前正在尝试在 Playground 中使用 实时照片 我知道框架 PHLivePhoto 我只是不知道是否可以在 Playground 中使用它们 因为没有太多可以 导入 的内容 因为似乎没有任何可用的
  • 如何在 JSDoc 中指定 Promise 的解析和拒绝类型?

    我有一些返回承诺对象的代码 例如使用Q https github com kriskowal qNodeJS 的库 var Q require q returns function task err return err Q reject
  • ruby 中不带参数的 DSL 块

    我正在用 ruby 编写一个简单的 dsl 几周前 我偶然发现了一些博客文章 其中展示了如何转换代码 例如 some method argument do book book some method on book book some ot
  • ReportViewer (SSRS) 与 VB.NET 出现错误

    我想嵌入一个带有 ReportViewer 对象的 net 网页 我创建了一个测试项目并具有
  • 如何在生产中的 Webpack 项目中使用 CDN 中的库

    我想用react min js来自生产中的 CDN 例如https unpkg com 电子邮件受保护 dist react min js https unpkg com react 15 3 1 dist react min js 让 W
  • 在当前控制台中运行进程

    我正在为 Windows 编写一个基本 shell 我想知道是否有任何方法可以运行子进程 Process process 以便它使用当前的控制台窗口 我的意思是我这样做not想要重定向输入 输出 我希望该进程从当前控制台获取输入并将输出直接
  • R 不接受 xpath 查询

    您好 我正在使用 R 中的 XML 包来抓取 html 页面 感兴趣的页面是http www ncbi nlm nih gov Protein 225903367 report fasta http www ncbi nlm nih gov