用于搜索专利数据库（即 USPTO 或 EPO）的 Python 模块

2023-11-24

对于我的工作，我必须寻找生物医学研究和工业领域的潜在客户。

我使用模块 biopython 编写了一些非常方便的程序，它有一个很好的用于搜索 NCBI 的界面。我还使用了 Clinical_Trials 模块来搜索 ClinicalTrials.gov。

我现在想搜索专利数据库，比如 EPO 或 USPTO，但我什至找不到 python 模块的痕迹。但也许我错过了一些明显的东西？

由于谷歌有一个专利搜索选项，我想知道是否有一个用于搜索谷歌的Python模块，它可以只适用于搜索专利？

您至少可以使用任何 XML 解析工具（例如 lxml python 模块）解析 USPTO。

Gabe Fierro 写了一篇很棒的论文，介绍了如何做到这一点，请点击此处：从 USPTO XML 中提取专利数据并格式化（无付费专区）

Gabe 还参与了一些关于这样做的有用讨论在这个谷歌群组里.

最后，如果您知道要查找的内容并且有足够的磁盘空间，您还可以获取本地存储的批量数据进行处理。美国专利商标局批量下载here.

还有什么更具体的问题请告诉我！我以前也曾涉足过这个领域:)

此外，Google Patent 搜索 API 已被弃用，但您现在可以使用 URL 标签通过主 Google 搜索 API 进行相同的搜索（我手边没有它们，但您可以通过 Google 专利搜索找到它们，该搜索将得到响应）由 google.com 提供）。

更新：现在在家里，您想要使用谷歌自定义搜索 API 进行专利搜索的标志是 &tbm=pts - 请注意，谷歌自定义搜索引擎并获取相同的代码对于专利搜索非常有益，因为提供的 JSON 具有具有专利特定字段的良好数据结构。

示例代码：

import requests
import urllib
import time
import json

access_token = <get yours by signing up for google custom search engine api>
cse_id = <get yours by signing up for google custom search engine api>

# Build url
start=1
search_text = "+(inassignee:\"Altera\" | \"Owner name: Altera\") site:www.google.com/patents/"
# &tbm=pts sets you on the patent search
url = 'https://www.googleapis.com/customsearch/v1?key='+access_token+'&cx='+cse_id+'&start='+str(start)+'&num=10&tbm=pts&q='+ urllib.quote(search_text)

response = requests.get(url)

response.json()
f = open('Sample_patent_data'+str(int(time.time()))+'.txt', 'w')
f.write(json.dumps(response.json(), indent=4))
f.close()

这将（在您添加免费 API 访问信息后）获取 Altera 拥有的前十项专利（作为示例）并将生成的 JSON 保存到文本文件中。打开您最喜欢的 Web JSON 编辑器并查看 JSON 文件。我特别建议查看 ['items'][] 和子 ['pagemap']。只需解析此 JSON，您就可以获得标题、缩略图、片段、标题、链接，甚至引用（如果相关）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

用于搜索专利数据库（即 USPTO 或 EPO）的 Python 模块的相关文章

celery任务eta已关闭，使用rabbitmq

我使用教程中的默认设置和在 ubuntu 上运行的rabbitmq 使 Celery 任务正常进行当我毫不延迟地安排任务时一切都很好但是当我给他们一个预计时间时他们会被安排在未来就好像我的时钟在某个地方关闭了一样下面是一些请求任
在二维数组中进行所有可能的组合

我正在尝试制作具有所有可能组合的 4x4 16 像素黑白图像数组我制作了以下数组作为模板 template 0 0 0 0 start with all white pixels 0 0 0 0 0 0 0 0 0 0 0 0 然后我想迭
如何打印前面有一定数量空格的整数？

C has printf Xd Y 它只打印整数 X 并使其在控制台窗口上占据 Y 空格例如 printf 3d 10 console 10 printf 5d 5 console 5 我如何在 python 3 中使用它 This pr
使用ideone时如何传入命令行参数？

我正在使用 ideone 在线解释器 http ideone com http ideone com 来测试一些 C 和 Python 程序如何指定命令行参数而不是使用 STDIN 输入看起来你不能但是快速破解应该做的伎俩 stati
caffe安装：opencv libpng16.so.16链接问题

我正在尝试在 Ubuntu 14 04 机器上使用 python 接口编译 caffe 我已经安装了 Anaconda 和 opencvconda install opencv 我还安装了咖啡中规定的所有要求并更改了注释块makefile
创建 xyz 海拔数据的曲面图

我正在尝试用 python 创建一座山的表面图其中我有一些 xyz 数据最终结果应该类似于that https i stack imgur com rKQV0 png 该文件的格式如下 616000 0 90500 0 3096 712
Discord.py 斜线命令在 cogs 中不起作用

我正在构建一个不和谐的机器人并且想要在 cogs 内使用斜杠命令但这些命令不显示或工作这是代码 cog guild ids 858573429787066368 861507832934563851 class Slash comma
在多核上运行 python 线程

我知道Python 2 7不允许在不同的内核上运行多个线程你需要使用multiprocessing模块以实现某种程度的并发性我正在看concurrent futuresPython 3 4 中的模块是否使用ThreadPoolExec
无法使用Python请求会话模块登录网站

我刚刚开始进行网络抓取对于我的第一个项目我尝试使用 requests Session 登录 artofproblemsolving com 并访问另一个用户的帐户这是我的代码 import requests LOGIN URL htt
matplotlib：渲染到缓冲区/访问像素数据

我想使用 matplotlib 生成的图作为 OpenGL 中的纹理到目前为止我遇到的 matplotlib 的 OpenGL 后端要么不成熟要么已经停止使用所以我想避免使用它们我当前的方法是将图形保存到临时 png 文件中并从
右键单击 QPushButton 上的 contextMenu

对于我的应用程序我在 Qt Designer 中创建了一个 GUI 并将其转换为 python 2 6 代码关于一些QPushButton 与设计器创建我想添加右键单击上下文菜单菜单选项取决于应用程序状态如何实现这样的上下文菜单
matplotlib vlines 图中未应用 y 轴的最小值

我正在 matplotlib 中绘制 vlines 图数据集中的所有 y 值如下 gt 0 我希望 y 轴最底部的刻度能够读取0 但相反我得到 500 这是代码 usr bin env python import numpy as np
“KMeans”对象没有属性“k”

我使用 Yellowbrick 包绘制数据集的肘部曲线以使用 KMeans 作为模型找到数据集的最佳簇数我正在使用 Scikit learn KMeans 和 Yellowbrick kelbowvisualizer 函数生成了肘部曲
增强迪基-富勒测试中的 BIC 在 Python 中到底是如何工作的？

这个问题是关于 statsmodels tsa stattools python 库 adfuller 中的增强迪基富勒测试实现原则上 AIC 和 BIC 应该计算一组可用模型的信息标准并选择最好的模型信息损失最低的模型但它们在增
如何在类型提示中定义元组或列表的大小

有没有办法在参数的类型提示中定义元组或列表的大小目前我正在使用这样的东西 from typing import List Optional Tuple def function name self list1 List Class1 if
如何将Python包从旧版本安装到新版本？

我正在使用 python 3 7 最近在 Linux 中安装了 python 3 8 是否有任何 bash 命令或脚本可以获取 3 7 的所有软件包列表并在 3 8 版本中一一安装我想避免每个包裹都手工完成注意我将它们安装在我的系统中
如何使用 python 模块的多个 git 分支？

我想使用 git 来同时处理我正在编写的模块中的多个功能我目前正在使用 SVN 只有一个工作区因此我的 PYTHONPATH 上只有该工作区我意识到这不太理想所以我想知道是否有人可以建议一种更正确的方法来做到这一点让我用一个假
带 Qt 的菜单栏/系统托盘应用程序

我是 Qt PyQt 的新手我正在尝试制作一个应用程序其功能将从菜单栏系统托盘执行这里展示了一个完美的例子我找不到关于如何做到这一点的好资源有人可以建议吗 Thanks 我认为您正在寻找与QMenu and QMainWindo
如何仅读取 CSV 文件每行的第一列 [重复]

这个问题在这里已经有答案了如何在Python中读取CSV文件每行的第一列我的数据是这样的 1 abc 2 bcd 3 cde 我只需要循环第一列的值另外当我在 calc 中打开 csv 文件时每行中的数据都在同一个单元格中这正常
将二进制数转换为包含每个二进制数的数组

我试图将二进制值转换为每个 1 0 的列表但我得到默认的二进制值而不是列表我有一个字符串我将每个字符转换为二进制它给了我一个列表其中每个字符都有一个字符串现在我试图将每个字符串拆分为值为 0 1 的整数但我什么也得不到 if

随机推荐

JDBC4中驱动程序类是如何定位的

JDBC 第 4 版中的重要补充之一您不必显式加载司机通过电话Class forName不再了当您的应用程序第一次尝试连接数据库时 DriverManager自动加载找到的驱动程序应用程序CLASSPATH 我的问题是如何如果类路径
如何为 IE8 填充 Array.prototype.includes()

我正在尝试填充数组方法includes 以与IE8一起使用我需要支持一个项目并且我不想使用indexOf 我知道有一个polyfill 所以我去了 https developer mozilla org en US docs Web Ja
AttributeError：类型对象“numpy.ndarray”没有属性“__array_function__”

我将 numpy 升级到最新版本现在导入 numpy 时出现以下错误 AttributeError 类型对象 numpy ndarray 没有属性数组函数我正在使用 numpy 版本 1 16 使用以下命令卸载 Numpy 的所有安装
Gnu-Screen：运行脚本，将命令发送到正在运行的屏幕会话

是否可以编写一个脚本来更改名称并打开对当前选项卡的监视假设它正在屏幕中运行 Thanks 从屏幕手册页 X Send the specified command to a running screen session You can us
所有对最大流量

给定一个有向加权图如何找到最大流量 or 最小切边在所有顶点对之间天真的方法就是简单地调用Max Flow像 Dinic 的算法其复杂度为O V 2 E 对于每对因此对于所有对来说都是O V 4 E 是否可以将复杂度降低到O V
如何从 .env 文件设置环境变量

假设我有 env 文件包含如下行 USERNAME ABC PASSWORD PASS 与正常人不同的是export前缀所以我无法直接获取文件创建从 env 文件加载内容并将其设置为环境变量的 shell 脚本的最简单方法是什么如果您
R (purrr) 展平命名列表以列出并保留名称

也许我遗漏了一些明显的东西但试图将 R 中的命名列表的命名列表甚至可能更加嵌套扁平化为最终一个平面列表 purrr and rlist似乎有这方面的工具我怎样才能实现子列表的名称成为扁平化结果列表的名称预加密例如list1 bli
在主对话框中嵌入对话框并通过 MFC 中的按钮单击进行切换

我有一个如下的设计所以基本上我想在应用程序主对话框中嵌入三个对话框并在它们之间切换对于每个按钮单击即按钮 1 将显示对话框 1 按钮 2 将隐藏对话框 1 并显示对话框 2 等等每个对话框都有不同的设计和功能我尝试使用 CPro
为什么 std::regex_iterator 会导致此数据堆栈溢出？

我一直在使用std regex iterator解析日志文件我的程序已经工作了好几个星期并且已经解析了数百万条日志行直到今天当今天我对日志文件运行它并得到堆栈溢出时事实证明只有日志文件中的一个日志行导致了问题有谁知道为什么我的
自从最近引入登录审核以来，我如何测试 Facebook 应用程序？

我正在开发一个 Facebook 应用程序它通过 API 调用来获取用户事件列表该应用程序将使用 Javascript 来调用用户事件边缘如下所示 FB api user id events function response if
Powershell 中加号 (+) 的特殊使用

除了其自然用法即两个参数相加之外您还可以使用加号登录 Powershell 进行特殊调用如下所示 System Net WebRequestMethods Ftp UploadFile UploadFile是一个公共静态字段根据
C#：以编程方式在工作表范围内创建“命名范围”

我们如何创建一个命名范围其范围设置为工作表因为我们可以从 Excel 手动执行此操作所以我想有一种方法可以在代码中执行此操作使用设置名称Range Name 属性创建一个工作簿范围的命名范围我尝试在范围名称前添加前缀按照建议
在 pandas MultiIndex DataFrame 中选择行

选择过滤行的最常见的 pandas 方法是什么索引为 MultiIndex 的数据帧基于单个值标签的切片基于来自一个或多个级别的多个标签进行切片过滤布尔条件和表达式哪些方法适用于哪些情况为简单起见假设输入数据帧没有重复的索引
在 Microsoft Edge 中使用 @font-face

我在这里处理一个奇怪的问题当我使用 font face 时 Microsoft Edge 浏览器似乎不加载字体我检查了所有运行 Windows 10 和 Microsoft Edge 的计算机我检查了http caniuse com
核心数据 - 在 Group By 中使用瞬态属性

我正在创建一个带有一些聚合数据的 UITableView 在此过程中需要使用节标题对表视图单元格进行排序和分组问题是我想在 NSFetchRequest 中使用瞬态属性来生成节标题和结果排序问题是在设置 NSFetchRequest
phoneGap Cordova 中的命令行失败，退出代码为 8

我正在尝试从phonegap 和cordova 开始我按照以下步骤http phonegap com install 但在命令下 phonegap run android在命令提示符下我收到以下错误 Command line failed
Fancy Box - 关闭 iframe 弹出窗口时如何刷新父页面？

我希望当我关闭 Fancy Box 弹出框架时刷新我的父页面我在弹出窗口中有一个登录页面因此我需要刷新父页面以在 Fancy Box 关闭时显示新的登录状态我可以让它在没有 iFrame 代码的情况下工作但我无法让它与 iFra
获取列名的 LINQ 成员表达式

Hello 我正在将 LINQ 和 EF 与 C 4 0 一起使用我已将基本的 ELMAH 表拖入 EF 多次构建和保存一切都如人们所期望的那样进行但尝试过于雄心勃勃需要一点帮助我试图从作为变量传入的表达式中获取列名称我想要的是
如何查找Java + JNI + C++进程中的内存泄漏

我有一个用 java 编写的项目使用 JNI 使用 C 库所有的代码都是我们写的所以我有所有的源代码几个小时后机器内存不足尽管我的进程只是迭代文件并且删除了与前一个文件相关的所有内存我确信存在内存泄漏通常我使用Valgri
用于搜索专利数据库（即 USPTO 或 EPO）的 Python 模块

对于我的工作我必须寻找生物医学研究和工业领域的潜在客户我使用模块 biopython 编写了一些非常方便的程序它有一个很好的用于搜索 NCBI 的界面我还使用了 Clinical Trials 模块来搜索 ClinicalTrial

用于搜索专利数据库（即 USPTO 或 EPO）的 Python 模块

用于搜索专利数据库（即 USPTO 或 EPO）的 Python 模块 的相关文章

随机推荐

热门标签

用于搜索专利数据库（即 USPTO 或 EPO）的 Python 模块的相关文章