R 不接受 xpath 查询

2023-12-28

您好，我正在使用 R 中的 XML 包来抓取 html 页面。感兴趣的页面是http://www.ncbi.nlm.nih.gov/ Protein/225903367?report=fasta http://www.ncbi.nlm.nih.gov/protein/225903367?report=fasta在该页面上有一个序列，当检查 chrome 中的元素时，xpath 是

//*[@id="gi_225903367_141"]

但是当我尝试使用以下方法拉取它时：

xpathSApply(htmlParse(fasta.url.content),"//*[@id="viewercontent1"]/pre")
Error: unexpected symbol in "xpathSApply(htmlParse(fasta.url.content),"//*[@id="viewercontent1"

我收到上述错误。

XML 包是否对 xpath 很挑剔？

这是使用 Mathius 提供的 xpath 的查询

xpathSApply(htmlParse(fasta.url.content),"//span[contains(@id,'gi_225903367_1')]")
list()
attr(,"class")
[1] "XMLNodeSet"

我得到一个空列表。我不怀疑 xpath 是不正确的，但我想知道这是否与 R 相关。

问题是页面是使用 javascript 动态创建的，并且序列在返回到 R 的渲染中不可见。

CRAN 包“rentrez”提供了一个接口eutils http://www.ncbi.nlm.nih.gov/books/NBK25501/，这是查询 Entrez 的编程方式

library(rentrez)
entrez_fetch(db="protein", id="225903367", rettype="fasta")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

xml

r

xpath

webscraping

R 不接受 xpath 查询的相关文章

是否可以创建根据输入对象名称自行命名的列表？

能够创建 R 列表对象而无需指定每个元素的名称对我来说非常有帮助例如 a1 lt 1 a2 lt 20 a3 lt 1 20 b lt list a1 a2 a3 inherit name TRUE gt b a1 1 1 a2 1 20
如何比较数据框1的每一行与数据框2的每一行？

我有两个数据框如下所示 x data frame Name c 200003 200260 400826 400863 500710 Chr c chr1 chr1 chr2 chr3 chr3 Position c 11880 1441
如何自动替换多个文件的文本内容中的字符？

我有一个文件夹 myfolder包含许多乳胶表我需要替换其中每个字符即替换任何minus sign by an en dash 只是为了确定我们正在替换连字符INSIDE该文件夹中的所有 tex 文件我不关心 tex 文件名手动执
R：使用数据框 A 中某个日期之前的值填充数据框 B 中的行

这可能非常复杂我怀疑需要先进的知识我现在有两种不同类型的 data frames 我需要组合数据数据框A 按患者 ID 列出所有输血日期每次输血均由单独的行表示患者可以进行多次输血不同的患者可以在同一天进行输血 Patient
DOMDocument::save[domdocument.save]：无法打开流：权限被拒绝

我有一个代码可以将 XML 文件保存到我的目录中它实际上在我的本地主机和我的共享主机中就像一个魅力但它在我的 Linux VPS 中不起作用我总是收到这个错误警告 DOMDocument save home admin xxxxxx
分析和衡量 R 代码中的技术质量：有类似于 SonarQube 的工具吗？

一个简单的问题有人知道是否存在类似于 sonarqube 的 R 代码工具吗或者声纳库我的意思是一个用于分析代码技术质量的工具而不仅仅是突出显示或语法格式提前致谢您可以使用lintr并将结果上传到声纳Qube 这里有一个例子
r 闪亮下载过滤数据表（DT）

我正在尝试做一个shiny应用程序下载过滤后的Datatable 过滤与search 通过删除行进行过滤delete button 下载部分按预期工作问题当我第一次使用数据表中的搜索区域进行过滤时如果我使用按钮删除一行它会重置第一个
如何创建序列化对象集 C#

有多种类型在特殊情况下可以以不同的方式配置如何将它们序列化 Serializable XmlRoot RootXml Namespace public class RootXml object schemaVersion XmlElem
在 dplyr 中，setdiff 和 anti_join 之间的本质区别是什么？

我仍在学习 DataCamp for R 的课程所以如果这个问题看起来很幼稚请原谅我考虑以下非常做作的示例 library dplyr library tibble type lt c Dog Cat Cat Cat name l
如何在 R 中的多图形环境中画一条线？

举一个非常简单的例子 mfrow c 1 3 每个图都是不同的直方图我将如何画一条水平线类似于abline h 10 所经过的all3位数也就是说甚至是它们之间的边距显然我可以为每个图形添加一条 abline 但这不是我想要的
在 Sql Server 中启用 DTD 支持

我有各种 xml 文档需要存储在数据库列中这些文档包含对 DTD 的引用并且 SQL Server 不会导入 xml 因为它存在安全风险如何在数据库上启用 DTD 支持以便它可以让我插入 xml 内容你必须CONVERT首先 MS
使用 xsd.exe 工具从具有多个命名空间的 XML 文件生成 XSD 文件

我想做的事我正在尝试为现有 XML 文件生成 XSD 文件我正在使用xsd exe工具随 Visual Studio 一起提供 XML 文件中的某些元素是命名空间限定的在某些情况下本地名称是相同的如下所示
一起使用 R6 类和 foreach() %dopar% 的问题

当与 foreach 一起使用时我在 R6 类上遇到问题可能与环境有关我使用的是 Windows 假设有两个 R6 类 class1 和 class2 class1 中的 method1 依赖于 class2 例如请参见下面的示例代
R 中计算滚动实现波动率的更快方法

我想计算一组指数的滚动 20 天已实现波动率这是我用来下载指数价格计算每日收益和 20 天已实现波动率的代码 library quantmod library PerformanceAnalytics tickers c RUT STO
对于 xml-2-xml xslt 它将从未选择的元素输出这些文本

我想通过 xslt 将一个 xml 传输到另一个 xml 下面是我的输入xml
读取r中不同目录中的多个文件[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我想从不同的目录读取多个 csv 文件然后将其放入单个数据框中我有两种目录可供阅读 A LogIIS 文件夹01 文件 csv 在
r - 如何在 normalizePath 中指定路径，或解决与其关联的此错误？

我正在学习 R 并将其安装在我的办公室计算机上我没有计算机的管理员权限因为我什至必须致电IT人员进行安装然后我安装一个包一开始输入时不起作用例如 install packages thepackage 错误信息是这样的 Error
如何选择将特定节点作为子节点的第一个前同级节点？

我一直在尝试编写一个 XPath 语句它将选择节点的第一个前同级节点该兄弟节点应该有一个特定的节点作为其子节点例如 a a
XML 模式文件中 xs 和 xsd 之间的区别？

两者有什么区别xs and xsdXML 模式文件中的前缀 From w3 org 上的 XSD 1 0 规范 http www w3 org TR xmlschema 1 Instance Document Constructions 模
有条件地为 R 中置信带之外的数据点着色

我需要对下图中置信带之外的数据点与带内的数据点进行不同的着色我是否应该在数据集中添加一个单独的列来记录数据点是否在置信区间内您能举个例子吗示例数据集 Dataset from http www apsnet org education

随机推荐

使用 django-tables2 时是否可以将模板标签应用于？

我正在使用 django tables2 为我创建表我需要将模板标签应用于其中一列中的每个单元格仅仅为了将模板标签应用到一列就需要花费大量额外的精力来创建自定义表格布局有没有办法在 django tables2 中做到这一点 Upd
Spark 应用程序中的垃圾收集时间非常长，导致程序停止

我正在本地模式下运行 Spark 应用程序我正在使用 Spark 1 5 2 和 scala 2 10 4 当我使用大型数据集作为输入我不断在日志中收到以下消息 16 01 04 14 44 12 INFO collection Ext
不可终止的 Oracle 会话正在等待“来自客户端的 SQL*Net 消息”事件

在 Oracle 11gR2 上我最近遇到了一个非常有趣的情况涉及阻塞但空闲 MERGE挂在 a 上的声明来自客户端的 SQL Net 消息事件导致后续并发执行MERGE通过以下方式阻止第一个语句的语句光标引脚 S 等待 X
将多个 xdebug 覆盖率结果整理到一份报告中？

我正在使用php 代码覆盖率 https github com sebastianbergmann php code coverage从一个 HTTP 请求通过 apache 收集覆盖率信息我想存储来自多个请求的覆盖率数据然后将结果整
Facebook 2014：如何创建一个带有 iframe 的简单页面？

我看过大量的指南和 YouTube 教程但似乎很难创建一个简单的空页面其中包含一个链接到另一个网站的 Iframe 你知道该怎么做吗我需要这样的东西 https www facebook com betfred app 3368396
在Heroku应用程序下挂载S3文件夹

是否有这样的概念在 Heroku 应用程序下安装资产文件夹然后将其链接到 S3 存储桶我有一个带有公共资产文件夹的节点应用程序我想 slugignore 本地项目上的 public 文件夹将 grunt 上传到 s3 存储
Mysql：如何选择具有特定值的组？

假设有这样一个表 mysql gt SELECT FROM tags post id tag id 1 2 1 3 1 1 2 1 2 2 5 rows in set 0 00 sec 字段名称非常不言自明我想选择post id同时具有
在 mysqli 准备好的语句中使用 null

在 mysqli 准备好的语句中 NULL 被转换为对于字符串或 0 对于整数我想将它存储为真正的 NULL 有什么办法可以做到这一点吗可以将 true NULL 值绑定到准备好的语句读取this http www php net
jquery：反转顺序

如何使用 jquery 反转订单我尝试了这样的建议但行不通 block item get reverse each function 看一看here http jsfiddle net BhTEN 我希望盒子能像这样重新排列 18 17
根据某些匹配隐藏某些按钮

如果符合以下规则是否可以隐藏某些按钮以下是用于创建按钮列的代码和用于获取匹配项的代码我尝试过 BookButtonCell Visible false 但它说它只是只读的 Thanks private void Form1 Load
实体框架查询多个集合

我的上下文标记为 this Configuration LazyLoadingEnabled false 我想加载选定的相关实体例子如 context Entry catalog Collection p gt p Products Qu
如何使for循环在无法达到预定数量时返回填充行？

我正在刮n来自 a b c d 源的相同类型数据的迭代但有时这些数据源之一将返回小于n值因为它没有太多可以提取的值例如我将设置limit 5 but c将只有 3 个值可供抓取问题是我通过跳过每个列表来组织返回的数据nth 值因此
因素数据框：将列分成两部分并提取数字

我有以下数据框 df 下面是我在数据框中的第一列df 1 Well and Depth Black Peak 1000 Black Peak 1001 Black Peak 1002 Black Peak 1003 RStudio 目前将此
在 Playground 中处理实时照片

我已经在网络上进行了大量搜索但我目前正在尝试在 Playground 中使用实时照片我知道框架 PHLivePhoto 我只是不知道是否可以在 Playground 中使用它们因为没有太多可以导入的内容因为似乎没有任何可用的
如何在 JSDoc 中指定 Promise 的解析和拒绝类型？

我有一些返回承诺对象的代码例如使用Q https github com kriskowal qNodeJS 的库 var Q require q returns function task err return err Q reject
ruby 中不带参数的 DSL 块

我正在用 ruby 编写一个简单的 dsl 几周前我偶然发现了一些博客文章其中展示了如何转换代码例如 some method argument do book book some method on book book some ot
ReportViewer (SSRS) 与 VB.NET 出现错误

我想嵌入一个带有 ReportViewer 对象的 net 网页我创建了一个测试项目并具有
如何在生产中的 Webpack 项目中使用 CDN 中的库

我想用react min js来自生产中的 CDN 例如https unpkg com 电子邮件受保护 dist react min js https unpkg com react 15 3 1 dist react min js 让 W
在当前控制台中运行进程

我正在为 Windows 编写一个基本 shell 我想知道是否有任何方法可以运行子进程 Process process 以便它使用当前的控制台窗口我的意思是我这样做not想要重定向输入输出我希望该进程从当前控制台获取输入并将输出直接
R 不接受 xpath 查询

您好我正在使用 R 中的 XML 包来抓取 html 页面感兴趣的页面是http www ncbi nlm nih gov Protein 225903367 report fasta http www ncbi nlm nih gov

R 不接受 xpath 查询

R 不接受 xpath 查询 的相关文章

随机推荐

热门标签

R 不接受 xpath 查询的相关文章