并行调用 API，每分钟有硬性限制

2023-12-30

我正在尝试对 API 进行并行调用。在停止之前，API 的调用限制为每分钟 1,200 次。在低于限制的情况下异步最有效的方法是什么？

def remove_html_tags(text):
    """Remove html tags from a string"""
    import re
    clean = re.compile('<.*?>')
    return re.sub(clean, ' ', text)

async def getRez(df, url):
async with aiohttp.ClientSession() as session:
        auth = aiohttp.BasicAuth('username',pwd)


        r = await session.get(url, auth=auth)


        if r.status == 200:
            content = await r.text()
            text = remove_html_tags(str(content))

        else:
            text = '500 Server Error'
        df.loc[df['url'] == url, ['RezText']] = [[text]]
        df['wordCount'] = df['RezText'].apply(lambda x: len(str(x).split(" ")))
        data = df[df["RezText"] != "500 Server Error"]


async def main(df):
    df['RezText'] = None
    await asyncio.gather(*[getRez(df, url) for url in df['url']])

loop = asyncio.get_event_loop()
loop.run_until_complete(main(data))

1200每分钟呼叫次数等于20每秒调用一次，这样您就可以将请求分成batches20 并在批次之间休眠一秒钟。

另一种选择是使用aiohttp.TCPConnector(limit=20)对于客户端会话，但这仅限制了数量并发请求，因此您最终可能会执行更多请求（如果 API 响应速度快于一秒）或更少请求（如果 API 响应速度慢于一秒）；看this https://stackoverflow.com/questions/61774125/aiohttp-set-number-of-requests-per-second相关问题。

批量示例：

# python 3.7+
import aiohttp
import asyncio

async def fetch(session, url):
    data = None
    async with session.get(url) as response:
        if response.status != 200:
            text = await response.text()
            print("cannot retrieve %s: status: %d, reason: %s" % (url, response.status, text))
        else :
            data = await response.json()
    return data

async def main(n):
    print("starting")
    session = aiohttp.ClientSession()
    tasks = []
    batch = []
    for i in range(n):
        batch.append("http://httpbin.org/anything?key=a%d" % i)
        if len(batch) >= 20:
            print("issuing batch %d:%d" % (i-20+1, i+1))
            for url in batch:
                task = asyncio.create_task(fetch(session, url))
                tasks.append(task)
            batch = []
            await asyncio.sleep(1)
    if batch:  # if batch length does not divide n evenly consume last batch
        print("issuing last batch %d:%d" % (n-len(batch), n))
        for url in batch:
            task = asyncio.create_task(fetch(session, url))
            tasks.append(fetch(session, url))
    responses = await asyncio.gather(*tasks, return_exceptions=True)
    await session.close()
    for response in responses:
        assert "args" in response
        # note that the responses will be in the order in which the requests were made
    print("finished")

if __name__ == "__main__":
    loop = asyncio.get_event_loop()
    loop.run_until_complete(main(111))

Output

starting
issuing batch 0:20
issuing batch 20:40
issuing batch 40:60
issuing batch 60:80
issuing batch 80:100
issuing last batch 100:111
finished

这里重要的一点是asyncio.create_task（创建一个任务并启动它，返回一个任务对象），await asyncio.sleep(1)（用于限制请求）和await asyncio.gather（等待所有任务完成运行）。
对于 Python asyncio.ensure_future代替asyncio.create_task.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

并行调用 API，每分钟有硬性限制的相关文章

Python3 类型错误：replace() 参数 1 必须是 str，而不是 int

我已经尝试了几天让这段代码在 MacOS 上运行但没有成功你能看一下我错过了什么吗运行 python 3 6 我已经上传了整个代码多谢 usr bin env python3 from future import print fun
React useEffect hook 和 Async/await 自己的获取数据函数？

我尝试创建一个从服务器获取数据的函数并且它有效但我不确定这是否正确我创建了一个函数组件来获取数据使用useState 使用效果 and 异步等待 import React useState useEffect from react
二进制数据的Python字符串表示

我试图理解 Python 显示表示二进制数据的字符串的方式这是一个使用的示例乌兰多姆操作系统 http docs python org library os html os urandom In 1 random bytes os ura
WPF应用程序，在打开窗口之前运行异步任务

我遇到了一个问题我需要在主窗口打开并显示之前运行异步任务 IE STAThread static void Main string args MainWindow window new MainWindow SplashScreen Sh
使用DockerOperator时如何同时使用xcom_push=True和auto_remove=True？

Problem 跑步时DockerOperator with xcom push True xcom all True and auto remove True 任务会引发错误就好像容器在读取其内容之前被删除一样STDOUT Exampl
VS Code Pylint 在缺失的函数/类文档字符串上用蓝色下划线突出显示整个函数

这种情况突然开始发生当出现缺少函数文档字符串警告时 python pylint 会用蓝色波浪线突出显示整个函数我怎样才能让它只突出显示函数定义或在定义行上制作一个小指示器在开发时突出显示整个文件是非常烦人的这是缺少类文档字符串的示例
从内存中发送图像

我正在尝试为 Discord 机器人实现一个系统该系统可以动态修改图像并将其发送给机器人用户为此我决定使用 Pillow PIL 库因为它对于我的目的来说似乎简单明了这是我的工作代码的示例它加载一个示例图像作为测试修改在其上
python matplotlib 使用按钮事件添加和删除图形中的文本

我试图在调用button press event 时将文本添加到鼠标指针位置的图形中并在调用button release event 时将其删除我已成功添加文本但无法将其删除这是我使用的代码的一部分 def onclick even
如何在 Python for 循环中获取 GAE ndb 中当前记录的密钥？

我目前有一个网页其中显示数据存储中的记录列表以及编辑链接我想从数据库转换它至新开发银行我是 Python 和 GAE 新手当前代码 tbody for listtype in listtypes tr td listtype Li
Buildozer Numpy RuntimeError：工具链损坏：无法链接简单的 C 程序

用 Python 编写我的第一个 Android 应用程序并使用 Buildozer 对其进行打包因为稍后在项目中需要使用numpy 所以我尝试打包以下测试代码 import numpy import kivy kivy require
更新或插入 MySQL Python

如果记录已存在我需要更新一行如果不存在我需要创建一个新记录我理解 ON DUPLICATE KEY 将使用 MYSQLdb 完成此操作但是我无法使其正常工作我的代码如下 cursor database cursor cursor
在Python中将用户昵称转换为正式名字

我正在尝试根据 Python 中的用户名字和姓氏映射来自不同系统的用户一个问题是名字在很多情况下都是昵称例如对于用户来说他的名字在一个系统中是 Dave 而在另一个系统中是 David python 中有没有简单的方法可以将这些
如何避免在matplotlib中调用latex（输出到pgf）

我使用 matplotlib 及其 pgf 后端来生成包含在 LaTeX 投影仪文档中的绘图当我使用未定义的乳胶命令时我遇到了麻烦但对于我的应用程序我不需要 matplotlib 来使用 Latex 生成标签或注释我只想要正确的
Pandas如何将多个函数应用于数据框

有没有办法像 DataFrameGroupBy agg 函数那样将函数列表应用于 DataFrame 中的每一列我发现了一个丑陋的方法来做到这一点 df pd DataFrame dict one np random uniform 0
如何更改Python使用的SQLite版本？

我在 Debian 9 12 上安装了 Python 3 8 和 SQLite 3 16 2 并且需要升级到较新版本的 SQLite 我已经下载并编译了 SQLite 网站上提供的合并并将其放入 usr bin 所以当我这样做时 sqli
Cypress.io 如何处理异步代码

我正在将旧的水豚测试转移到 cypress io 因为我们的应用程序正在采用 SPA 方式在我们的案例中我们有超过 2000 个测试涵盖了很多功能因此测试功能的常见模式是让用户创建并发布报价一开始我写了 cypress 浏览页面
(venv) (base) 都在 python 项目上活跃，我如何只进入 venv？

所以我将 vscode 与 conda 对于 django 项目一起使用并尝试激活名为 venv 的虚拟环境它来自 base C Users User Desktop pfa master pfa master venv Script
在Python中通过sys.stdout写入unicode字符串

暂时假设一个人无法使用print 从而享受自动编码检测的好处所以这给我们留下了sys stdout 然而 sys stdout太蠢了不做任何合理的编码 http bugs python org issue4947 现在人们阅读 Pytho
使用 pyspark 计算所有可能的单词对

我有一个文本文档我需要找到整个文档中重复单词对的可能数量例如我有下面的word文档该文档有两行每行用分隔文档 My name is Sam My name is Sam My name is Sam My name is Sa
如何在Python中显示坐标网格线的变换？

假设我有常规的笛卡尔坐标系 x y 并且我考虑一个矩形网格区域 D 分成小方块我想看看域 D 如何在 Python 中的坐标变换 T x y gt u x y v x y 下映射我正在寻找这样的东西 See here https mat

随机推荐

如何在 SQLite 中插入具有唯一 ID 的重复行？

这看起来很简单我想在 SQLite 表中复制一行 INSERT INTO table SELECT FROM table WHERE rowId 5 如果没有显式的唯一列声明则该语句将起作用但声明了表的第一列rowID INTEGER
使用ActionCable，多种识别方式

我使用 ActionCable 开发 Ruby on Rails 5 1 应用程序通过 Devise 进行用户身份验证 https rubytutorial io actioncable devise authentication 适用于
Intellij 调试 Docker 容器不断给我 IO 异常握手失败

我正在尝试在 Intellij v2020 1 中设置远程调试器但不断收到以下错误无法打开调试器端口 localhost 5005 java io IOException 握手失败连接过早关闭在我的 docker compose 文
是否可以在cmake中不生成ALL_BUILD项目？

我不需要 ALL BUILD 子项目我可以避免生成它吗谢谢 CMake 问题 16979 正在生成 ALL BUILD 目标 https gitlab kitware com cmake cmake issues 16979 The A
Facebook Graph API gem

我想在我的 Rails 应用程序中使用 Facebook 图形 API 与 FB 图形 API 一起使用的推荐 gem 是什么 Thanks 这是一个写得很好的 FB 图形支持 Ruby https github com nov fb gr
在 SSRS 中复制并粘贴表 (tablix)

我有一个包含一天数据的 tablix 我需要在底部有相同的数据但在 3 个不同的行中我想在底部复制主要日期表 3 次然后为每个表使用不同的数据集我尝试复制 tablix 并将其粘贴到Body在 tablix 下方但出现以下错误报
C#：将数组分配给另一个数组：复制还是指针交换？

抱歉问这个问题我一直在谷歌上搜索了一下但似乎出现的是对克隆或复制方法的引用而不是我的问题的实际答案C 我有两个字节数组它们正在被两个线程访问 private byte buffer1 new byte size private by
如何使用 python 读取 CSV 文件时跳过空白行

这是我的代码我可以打印每一行但是当出现空白行时它会打印由于CSV文件格式所以我想在出现空行时跳过 import csv import time ifile open C Users BKA4ABT Desktop Test Spe
如何将输出的 Fortran 二进制 NxNxN 矩阵读入 Python

我用 Fortran 写出了一个矩阵如下所示 real kind kind 0 0d0 dimension 256 256 256 dense CALCULATION inquire iolength reclen dense open
如何在不不断扫描的情况下检测目录或文件何时发生更改

除了读取所有文件并将它们与以前的快照进行比较之外有没有办法在 Windows 中的 C 中检测目录何时发生更改如果需要的话我不介意 PInvoke EDITFileSystemWatcher 类很棒但有一个问题是您必须启动后台任务
一对一字段 Django 管理员

编辑为使用一对一字段我想将建筑物的面积添加到 django modeladmin 中表结构是 class Area models Model id models IntegerField Buildings db column id a
Kubernetes Nginx Ingress 删除部分 URL

我正在 Kubernetes 在 AKS 上部署一个简单的应用程序该应用程序位于使用 Nginx 的 Ingress 后面并使用 Nginx helm 图表进行部署我遇到一个问题由于某种原因 Nginx 似乎没有将完整的 URL
AWS lambda读取zip文件执行验证并解压到s3存储桶（如果验证通过）

我有一个 zip 文件到达 s3 存储桶的要求我需要使用 python 编写一个 lambda 来读取 zip 文件执行一些验证并在另一个 S3 存储桶上解压缩 Zip 文件包含以下内容 a csv b csv c csv trigge
读取 HttpPost 响应

我使用此代码向 http 服务器发送请求 HttpClient client new DefaultHttpClient HttpPost post new HttpPost http 192 168 0 1 test php HttpRe
一步一步 oAuth Rest C# winform 示例 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我已经尝试了一段时间了需要从头开始
XML RPC - 从 C# 调用 python 函数

我正在使用库xml rpc net 2 5 0用于在 C 中创建调用一些 python 方法的 XML RPC 客户端客户端位于Windows7机器中服务器位于运行red hat的VMWare中调用python函数的客户端代码 mai
在另一个类中使用实例方法作为装饰器

我正在尝试创建一个类 MySerial 实例化一个串行对象以便我可以写入读取串行设备 UART 有一个实例方法是一个装饰器它包装了属于完全不同的类的函数 App 因此装饰器负责写入和读取串行缓冲区如果我创建一个实例MySerial在
如何在apache solr中以原始嵌套形式检索json？

我在用阿帕奇索尔 for 文本搜索我有nested document structure 这是one json file id 1 info first name John last name Doe gender male 我创建了一
将项目与 Eclipse 中的 Sonar 关联

我有 Eclipse Indigo 3 7 基础和 MyEclipse 10 Java 企业开发插件我已经为eclipse安装了Sonar插件安装 Sonar 服务器并从本地主机 localhost 9000 本地运行它在 Eclip
并行调用 API，每分钟有硬性限制

我正在尝试对 API 进行并行调用在停止之前 API 的调用限制为每分钟 1 200 次在低于限制的情况下异步最有效的方法是什么 def remove html tags text Remove html tags from a str

并行调用 API，每分钟有硬性限制

并行调用 API，每分钟有硬性限制 的相关文章

随机推荐

热门标签

并行调用 API，每分钟有硬性限制的相关文章