下载 PMC 和 PubMed 数据库中的所有全文文章

2024-03-30

根据 NCBI Help Desk 回答的问题之一,我们无法“批量下载”考研中心。但是,我可以使用“NCBI E-utilities”下载吗allPMC 数据库中的全文论文使用Efetch或者至少使用以下命令找到所有相应的 PMCidEsearch在 Entrez 编程实用程序中?如果是,那么如何?如果无法使用电子工具,还有其他方法可以下载所有全文文章吗?


首先,在批量下载文件之前,我强烈建议您阅读电子公用事业使用指南 https://www.ncbi.nlm.nih.gov/books/NBK25497/#_chapter2_Usage_Guidelines_and_Requiremen_.

如果您想要全文文章,您将需要将搜索限制为打开访问文件。此外,如果您想要任何好的文章,我建议您也将搜索限制在 Medline 文章中。然后你就可以进行搜索了。

使用 Biopython,这给了我们:

search_query = 'medline[sb] AND "open access"[filter]'

# getting search results for the query
search_results = Entrez.read(Entrez.esearch(db="pmc", term=search_query, retmax=10, usehistory="y"))

您可以使用搜索功能PMC网站 https://www.ncbi.nlm.nih.gov/pmc它将显示生成的查询,您可以将其复制/粘贴到代码中。 现在您已经完成搜索,您可以实际下载文件了:

handle = Entrez.efetch(db="pmc", rettype="full", retmode="xml", retstart=0, retmax=int(search_results["Count"]), webenv=search_results["WebEnv"], query_key=search_results["QueryKey"])
  • 您可能想通过更改来批量下载retstart and retmax通过循环中的变量以避免服务器泛滥。
  • If handle仅包含一个文件,handle.read()包含整个 XML 文件作为字符串。如果包含更多,则文章包含在<article></article> nodes.
  • 全文仅以 XML 形式提供,并且 pubmed 中可用的默认解析器不处理 XML 命名空间,因此您将需要自己使用元素树 https://docs.python.org/3/library/xml.etree.elementtree.html(或其他解析器)来解析您的 XML。
  • 在这里,通过电子实用程序的内部历史记录可以找到这些文章,可以通过webenv参数并启用感谢usehistory="y"论证中Entrez.read()

有关使用 ElementTree 进行 XML 解析的一些提示: 您无法删除孙节点,因此您可能需要递归删除一些节点。node.text返回文本node,但仅限于第一个孩子,因此您需要按照以下方式做一些事情"".join(node.itertext())如果你想获取给定节点中的所有文本。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

下载 PMC 和 PubMed 数据库中的所有全文文章 的相关文章

  • 将 Dwolla 与 PHP 及其 API 集成

    前言 好吧 我过去使用过 API 例如 TwitterAPI 但我总是使用库和一些文档来帮助我进行连接和检索令牌 我对 API 的工作原理有了基本的了解 好的 我尝试了多种使用 PHP 请求 dwolla API 的方法 我尝试过制作一个
  • 如何在 Nodejs 中创建代理下载

    我想创建一个nodejs服务器 它充当下载文件的代理 即用户点击 在下载按钮上 从nodejs服务器调用get nodejs服务器从不同的服务器获取链接 远程服务器并开始下载 以 TB 为单位 然后将该下载转发给用户 TB 文件不应存储在
  • 如何添加更多数据存储在 jenkins Rest api 中

    为了使问题变得简单 我知道我可以通过以下方式获取一些构建信息https jenkins server https jenkins server api json xml python 我获得了有关该构建记录的大量信息 但是 我想向该构建记录
  • 如何使用 JavaScript 或 jQuery 从 URL 下载文件?

    我使用 jQuery fileDownload 插件从 URL 下载文件 fileDownload url contentType text csv contentDisposition attachment filename url sp
  • Postman如何发送请求? ajax,同源策略

    我发现了这个非常有用的 Chrome 扩展程序 名为 Postman 这是一个非常有用的扩展 特别是当您正在编写 RESTful 应用程序时 我感到困惑的一件事是这个插件 扩展如何能够在不同的域上成功发送 POST 请求 我尝试像这样使用
  • 如何安装适用于 Windows C++ 的最新版本 OpenGL?

    我正在使用 Visual Studio 2010 运行 Windows 7 包含的 OpenGL 版本 include 是版本 1 1 我希望使用合理的当前版本 某种版本 3 或 4 我需要做什么才能达到该状态 OpenGL SDK 页面位
  • 学院/大学数据 API [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在尝试构建一个应用程序 允许用户查找特定大学并查看有关该大学的数据 录取率 SAT 分数 规模等 但
  • 如何使用 Sound Cloud API 按标签搜索特定用户的曲目?

    我想通过仅与我的用户名 即皇家歌剧院 相关的标签搜索曲目 例如 http api soundcloud com users royaloperahouse tracks client id 238947HSGDHSDG tags eric
  • 使用 PHP 发布到 Blogger

    我在使用 PHP 的 Blogger API 时遇到问题 我需要的是能够将新的博客文章发布到我的博客帐户 我使用的代码取自 Google API 页面 http code google com intl nl apis blogger do
  • useState 由于某种原因没有更新?

    当我尝试使用 axios 从后端 API 获取一些数据 并在由于某种原因获得结果后设置状态时 状态不会更新 当我尝试使用状态时 它只会向我显示一个空数组 但有趣的是当我console log res data 它会毫无问题地向我显示我的列表
  • 从我自己的博客获取帖子[关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 是否有任何 API 通过它我可以从 wordpress com 上我自己的博客获取帖子并将它们放在我的
  • PayPal Rest API for Payments 在沙箱中返回 NULL

    我有一个 PayPal 沙盒帐户 我可以在 PHP 上使用curl 通过 api 检索令牌 但是处理测试卡只会返回 null 有人看到代码有问题吗 这是 PayPal 沙盒的已知问题吗 下面代码片段中的客户端是伪造的 但是 如前所述 使用我
  • Sharepoint 上的 WebPart 在本地下载文件 - 我需要将其发送到客户端

    请帮助我在使用 Sharepoint 站点的计算机上下载文件 而不是在具有 Sharepoint 服务器的计算机上 public class WebClientBL static WebClient client new WebClient
  • 简单的跨平台 TCP IP API?

    我不打算使用像 QT 或 wxWidgets 的 API 这样的大东西 我只想要可以在 Android iOS Windows Mac Linux 上运行的简单套接字 我正在制作一个事件驱动的纸牌游戏 所以 TCP 是最好的 本质上 我只想
  • 如何使用 Javascript 从 Chrome iOS 下载 blob 文件?

    如何使用 Javascript 从 Chrome iOS 下载 blob 文件 我正在从 iOS 下载文件 pdf excel txt png iOS 没有文件系统 这对下载来说是一个问题 我创建了一个代码 根据操作系统和导航器 如果需要
  • Codeception API 测试响应返回“N/A”

    我正在使用 Laravel 和 Codeception 作为测试框架编写 API 我无法让 Codeception 返回响应代码 我可以从 Codeception 获取响应代码 以及 JSON 响应 我编写了一个简单的测试来从 GET 请求
  • 使用 OkHttp 下载损坏的文件

    我编写的下载文件的方法总是会产生损坏的文件 public static String okDownloadToFileSync final String link final String fileName final boolean te
  • Google Sheets API v4 和 valueInputOption

    我的电子表格中有三列 第一个是日期 第二个和第三个是简单字符串 当我批量上传数据时valueInputOption RAW 我的日期列得到错误的结果 所有日期前面都有一个看不见的撇号 字符串列没问题 当我使用valueInputOption
  • 如何在flutter项目中使用http拦截器?

    我必须向我的所有 Api 添加标头 有人告诉我为此使用 http 拦截器 但我无法理解如何做到这一点 因为我是颤振的新手 谁能帮我举个例子吗 您可以使用http 拦截器 https pub dev packages http interce
  • Streamlabs API 405 响应代码

    我正在尝试使用Streamlabs API https dev streamlabs com Streamlabs API 使用 Oauth2 来创建应用程序 因此 首先我将使用我的应用程序的用户发送到一个授权链接 其中包含我的应用程序的客

随机推荐

  • Zapier:修改 webhook 侦听器 HTTP 响应?

    某些 API 需要 Webhook 侦听器响应中的附加信息 例如 我正在尝试订阅 Outlook com 的推送通知服务 该服务描述了以下流程 Outlook 通知服务尝试使用侦听器服务验证通知 URL 它在验证请求中包含验证令牌 如果侦听
  • Google REcaptcha 未显示

    我的中有以下内容 div class g recaptcha 这在我的 但无论是在 Firefox 还是 Chrome 上都没有显示任何内容 这是一个已知问题吗 确保是 head 标签关闭之前的最后一件事 这为我解决了同样的问题 div
  • 工具提示问题,MatTooltip 在 Angular 中不起作用

    我正在尝试在仪表板页面中插入通知工具提示 但该工具提示不起作用 我对 Angular 非常陌生 因此任何有关此问题的线索都将受到高度赞赏 module ts import MatTooltipModule from angular mate
  • find 命令仅搜索非隐藏目录

    在以下命令中 我只想搜索非隐藏的目录 如何使用以下命令执行此操作 我想在搜索日志文件时忽略隐藏目录 find home tom project name log txt ls home tom project dir1 dir2 backu
  • JAXB 绑定嵌套元素

    我正在使用 JAXB impl 我需要能够将嵌套元素作为简单类型映射到类字段 例如
  • 在 JavaScript 中使用 for..of 迭代时从数组中删除元素应该是安全的吗?

    我知道它适用于Set 但我的印象是它也可以与 Array 一起使用 所以我在 Chrome 中尝试了一下 很惊讶它不起作用 const array 1 2 3 4 5 6 for const item of array if item 3
  • 如何获取文件的文件类型

    有没有办法让VB net中的Windows资源管理器中显示的文件类型 例如 在 Windows 资源管理器的详细信息视图中可以看到 Name Date Modified Type Size A PDF 05 06 2017 5 54PM A
  • 无法访问生成配置管理器或 Visual C# 2010 Express 中的生成配置

    完整故事 通常 当我安装 Visual C 2010 Express 时 我做的第一件事就是切换到专家设置 这使我可以访问构建配置以及相应的管理器 最近的安装似乎行为不当 我创建的第一个项目是 XNA 4 0 刷新 项目 我导入了一些旧代码
  • Cordova / Ionic - 从 InAppBrowser 下载文件

    场景是这样的 我在InAppBrowser中打开一个网站 用户结束那里的工作后 网站生成一个 pdf供用户下载 问题是pdf没有下载 它在浏览器 有没有办法让它从 InAppBrowser 下载 我目前正在开发一个 iOS 应用程序 因此该
  • Laravel APP_LOCALE 西班牙语

    在 Laravel 5 4 中 env I have APP LOCALE es APP FALLBACK LOCALE en APP LOCALE PHP es US and in config app php locale gt env
  • 如何将数据库路由器添加到 Django 项目

    我正在按照此处有关如何在一个 Django 项目中处理多个数据库的说明进行操作主题 数据库 多数据库 https docs djangoproject com en 2 1 topics db multi db 我已经创建了所需的两个路由器
  • 如何向 UITableViewCell 添加手势?

    我想为每个单元格添加点击手势UITableView编辑其中的内容 添加手势的两种方法是通过代码或通过情节提要 我都尝试过 但都失败了 我可以添加一个手势吗every表格中的单元格带有情节提要拖放功能 它似乎只向第一个单元格添加手势 在代码中
  • 一小时后如何删除本地存储?

    我的数据是对象 我使用本地存储 javascript 保存它 如下所示 localStorage setItem storedData JSON stringify data 我只想保留该数据 1 小时 因此 如果超过 1 小时 数据将被删
  • 将 std::function 绑定到不同对象实例的相同函数

    是否可以重新绑定 std function 以指向相同的函数但具有不同的对象实例 假设我有一个对象 它的 std function 绑定到另一个函数 但如果该对象被复制到另一个实例 我想将 std function 重新绑定到该新实例而不是
  • bash 中双方括号的含义[重复]

    这个问题在这里已经有答案了 At this 凯尔 布 兰特回答中的问题 https serverfault com questions 53577 linux bash syntax meaning of and the 构造被描述为 ba
  • 使用字符串类输入空格时出现 cin 问题

    我有以下代码 main cpp include
  • 如何将字符串/数字附加到字符串?

    我有一个函数 void generateLevelFromPlist int currentLevel NSString mainPath NSBundle mainBundle bundlePath itemPositionPlistLo
  • python,pandas,按条件删除行

    您好 我需要帮助根据条件删除一些行 如果估计价格减去价格超过 1500 正 则删除该行 price estimated price 0 13295 13795 1 19990 22275 2 7295 6498 例如只有索引 1 会被删除
  • 如何在关系中设置主键?

    我想知道如何正确设置主键 in a Relation 例如 我们有ER图其中包含元素 关键属性 关键属性较弱 识别关系 关联实体 为了将其翻译成关系模型我们应该做一些技巧 上面的所有元素都处理关系的主键 但它们都是自然键 这样我们就可以离开
  • 下载 PMC 和 PubMed 数据库中的所有全文文章

    根据 NCBI Help Desk 回答的问题之一 我们无法 批量下载 考研中心 但是 我可以使用 NCBI E utilities 下载吗allPMC 数据库中的全文论文使用Efetch或者至少使用以下命令找到所有相应的 PMCidEse