python下载速度极慢

2023-11-24

有没有办法提高Python上的url下载速度？

我有一个用 VB6 编写的程序，无需尝试即可使用 Python。我已经转换了这个东西，现在正在尝试，Python（linux）中的东西似乎慢得多，时间是原来的两倍。即使是该程序的初始版本似乎也比我在 Windows 上习惯的时间要长。

我尝试过同时使用urllib(2.7), urllib.request（3.3），以及requests。目前我正在尝试urllib3而且速度也没有更快。在 Windows 上通常需要 45 分钟才能在同一台计算机上通过相同的 Internet 连接完成相同的任务，在 Linux 上则需要近 2 个小时。任务只是搜索互联网并在搜索找到所需内容时下载文件......只是一系列潜在的文件名。

我还会问，因为今天下午到目前为止已经发生了不止一次，我该如何检测 110 错误代码（连接超时）。我下面使用的不起作用，它仍然杀死了程序。

import urllib3

http = urllib3.PoolManager()

def dl_10(self):
        self.NxtNum10 = int(self.HiStr10)
        while self.NxtNum10 < int(self.HiStr10)+9999:
                url = 'http://www.example.com/videos/encoded/'+str(self.NxtNum10)+'.mp4'
                r = http.request('GET', url)
                if r.status==404:
                        self.NxtNum10 +=1
                        continue
                elif r.status==110:
                        continue
                else:
                        urllib.request.urlretrieve(url,str(self.NxtNum10)+'_1.mp4')
                        statinfo = os.stat(str(self.NxtNum10)+'_1.mp4')
                        if statinfo.st_size<10000:
                                os.remove(str(self.NxtNum10)+'_1.mp4')
                        else:
                                self.End10 = self.NxtNum10
                self.NxtNum10 +=1

        self.counter +=1
        self.NxtNum10 = 'FINISHED'

这是通过线程运行的，我认为这不会有任何区别。就像我说的，使用 urllib(2.7) 的初始写入也很慢，而且它没有使用线程，我只是运行该程序 10 次，就像我在 Windows 上一直运行的那样。

有没有更快的方法可以用Python从互联网上获取资料？

我发现使用下面的方法而不是直接使用 urlretrieve 会快得多：

resp = urllib2.urlopen(url)
respHtml = resp.read()
binfile = open(filename, "wb")
binfile.write(respHtml)
binfile.close()

直接写入文件。希望对你有帮助

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python下载速度极慢的相关文章

围绕 readline 构建的 python 批处理的触发器选项卡完成

背景我有一个 python 程序它导入并使用 readline 模块来构建自制的命令行界面我有第二个 python 程序围绕 Bottle 一个 Web 微框架构建充当该 CLI 的前端第二个 python 程序向第一个程序打开
Python Popen 与 psexec 挂起 - 不良结果

我对 subprocess Popen 和我认为是管道的问题有疑问我有以下代码块从 cli 运行时 100 都不会出现问题 p subprocess Popen psexec serverName get cmd c ver echo
Python - 将宽字符字符串从二进制文件转换为 Python unicode 字符串

这是漫长的一天我有点困惑我正在读取一个包含大量宽字符字符串的二进制文件我想将它们转储为 Python unicode 字符串为了解压非字符串数据我使用 struct 模块但我不知道如何对字符串执行相同的操作例如阅读系列一
我怎样才能更多地了解Python的内部原理？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我使用Python编程已经有半年多了我对Python内部更感兴趣而不是使用Python开发应用程序
如何正确地将 MIDI 刻度转换为毫秒？

我正在尝试将 MIDI 刻度增量时间转换为毫秒并且已经找到了一些有用的资源 MIDI Delta 时间刻度到秒 http www lastrayofhope co uk 2009 12 23 midi delta time ticks
Django 模型在模板中不可迭代

我试图迭代模型以获取列表中的第一个图像但它给了我错误即模型不可迭代以下是我的模型和模板的代码我只需要获取与单个产品相关的列表中的第一个图像模型 py class Product models Model title models
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
对图像块进行多重处理

我有一个函数必须循环遍历图像的各个像素并计算一些几何形状此函数需要很长时间才能运行在 24 兆像素图像上大约需要 5 小时但似乎应该很容易在多个内核上并行运行然而我一生都找不到一个有据可查解释充分的例子来使用 Multiproc
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
如何从Python中的字符串中提取变量名称和值

我有一根绳子 data var1 id 12345 name John White python中有没有办法将var1提取为python变量更具体地说我对字典变量感兴趣这样我就可以获得变量的值 id和name python 这是由提供
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
Seaborn Pairplot 图例不显示颜色

我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常但由于某种原因图例不会显示相关的颜色我无法找到解决方案因此如果有人有任何建议请告诉我 x sns pairplot stats2 hue
在 Pandas 中使用正则表达式的多种模式

我是Python编程的初学者我正在探索正则表达式我正在尝试从描述列中提取一个单词数据库名称我无法给出多个正则表达式模式请参阅下面的描述和代码描述 Summary AD1 Low free DATA space in data
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
迭代 my_dict.keys() 并修改字典中的值是否会使迭代器失效？

我的例子是这样的 for my key in my dict keys my dict my key mutate 上述代码的行为是否已定义假设my dict是一本字典并且mutate是一个改变其对象的方法我担心的是改变字典中的值可能
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在
迭代 pandas 数据框的最快方法？

如何运行数据框并仅返回满足特定条件的行必须在之前的行和列上测试此条件例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1

随机推荐

架构 i386 的未定义符号，为 iOS 构建？

我已经下载了 iProcessing 框架允许您为 iPhone 构建本机 javascript 应用程序当我尝试编译时我得到 Undefined symbols for architecture i386 ADBannerConte
在计算机之间导入/导出 Chrome devtools 断点和设置

Quoting 最初的想法我遇到了一个问题我需要将所有调试器断点共享给我的同事以便在他结束时调试问题因此考虑实施诸如从一个系统导出调试器点并在另一系统导入之类的东西由于 devtools 不提供内置的导入导出功能还有其他方法吗
将远程图像保存到隔离存储中

我尝试使用此代码下载图像 void downloadImage WebClient client new WebClient client DownloadStringCompleted new DownloadStringComplete
如何防止 URLDownloadToFile 从缓存中检索？

我正在使用 URLDownloadToFile 从网站检索文件后续调用将返回原始文件而不是更新版本我假设它正在检索缓存的版本在调用 URLDownloadToFile 之前使用相同的 URL 调用 DeleteUrlCacheEntr
invalidateList 和 invalidateDisplayList 有什么区别？

我有一个 DataGrid 其中填充有 ArrayCollection 中的对象更新对象的字段之一后我希望屏幕更新数据源不可绑定因为我是在运行时构建它的而且我还不知道如何使其可动态绑定这是另一个问题在这种情况下如果我在网格上
清理 Mercurial 存储库

我的 hg 存储库的历史记录中有一堆文件已被删除它们导致存储库变得相当大其中一些是图像以及项目早期的 sql 转储以及其他一开始就不应该提交的东西我如何让 Mercurial 忘记这些东西并再次将我的存储库缩小到合理的大小我是否
C# 中的非对称加密示例

我需要通过 TCP 连接将机密数据发送到服务器我做了很多研究并且理解了理论部分根据我的研究我想做以下事情注意有一个服务器和一个客户端我们假设客户端或服务器的公钥可以被任何人获取客户创建他的公钥和私钥他能够用他的私钥加密并用他的
不带值的 MediaWiki URL 参数

The query的一部分URL似乎由键值对组成并由相关联我一直习惯使用 jQuery param 函数对我的查询字符串进行 URL 编码因为我发现它使我的代码更具可读性和可维护性在过去的几天里我发现自己在调用 MediaWiki
SimpleDateFormat 类中有哪些可用的日期格式？

谁能告诉我 SimpleDateFormat 类中可用的日期格式我已经浏览了 api 但找不到满意的答案非常感谢任何帮助下面详细描述了日期和时间格式 SimpleDateFormat Java Platform SE 7 日期和时间模
如何将 String 上的 PageRequest 作为数值进行排序

我目前有一个系统可以过滤和排序数据库中的记录并将它们作为分页对象返回其中一行是这样的 final PageRequest request new PageRequest this pagingSettings getPageNumber
已知起点、终点和半径，如何求圆弧圆周上的点？

请参阅下图以直观地了解我的问题我有点 1 和 2 的坐标它们是通过使用其他可用信息的公式得出的参见问题如何计算已知半径和圆心的圆上的点我现在需要做的与轨道建设分开是将点 1 和点 2 之间的点绘制为绿色这样做的最佳方法是什么
Cordova 6.4.0 Android 构建发布 apk 时出错

我有一个项目在 cordova 6 3 1 上运行良好然后我将 cordova 和我的项目更新到 6 4 0 在此之后我第一次构建时 gradle 也自动更新了现在我遇到一个重要的问题我需要在 build json 文件中包含密钥库
MousePressEvent，QGraphicsView中的位置偏移

我有一些困难QGraphicsView and QGraphicsScene 当我缩放取消缩放场景并使用 mousePressEvent 创建项目时我的位置有一个偏移如何避免这种情况 event pos 似乎是问题 from PyQt
如何使用 selenium 3.0.0 beta 关闭 geckodriver

环境 Win 7 Selenium 3 0 0 测试版 FireFox 49 0 1 System setProperty webdriver gecko driver C geckodriver exe WebDriver driver
Apache ProxyPass 未加载资源

我配置了 apache proxypass 它可以工作但无法加载图像 javascript CSS 等我想 proxypass 到另一台服务器而不是本地主机以下是我的配置查看错误图像
Google 地图 API 的服务帐户

On the Google 云身份验证概述页面上对云服务进行了以下说明对于几乎所有情况无论您是在本地开发还是在外部开发生产应用程序您应该使用服务帐户而不是用户帐户或 API 密钥考虑到这一点我的问题是当使用 Google
异常处理 ASP.NET MVC Web API

首先是的我们已经创建并正在使用一个继承自 ExceptionFilterAttribute 的异常过滤器它会在应用程序启动时在我们的身份过滤器之后立即注册到配置中并且如果我们的 API 内部某个地方发生错误它的工作效果几乎与预期一
如何处理 Web 驱动程序 Selenium python 浏览器或应用程序可能不安全的问题？

我正在尝试自动登录 Gmail 但看到此错误我认为这一定是因为该网站能够检测到自动化并阻止它大家能告诉我如何克服这个问题吗我的个人帐户没有发现此问题但只有普通帐户才会出现此问题 In you account profile in S
在 kableExtra() 中设置字幕格式

是否可以将字幕格式设置为kableExtra 我想在编织时将表格的标题居中并加粗HTML in RMarkdown 我试图将桌子包裹起来CSS div文本居中的位置但这并没有产生预期的结果样本表 library kableExtra k
python下载速度极慢

有没有办法提高Python上的url下载速度我有一个用 VB6 编写的程序无需尝试即可使用 Python 我已经转换了这个东西现在正在尝试 Python linux 中的东西似乎慢得多时间是原来的两倍即使是该程序的初始版本似乎也比

python下载速度极慢

python下载速度极慢 的相关文章

随机推荐

热门标签

python下载速度极慢的相关文章