在 Python 中打开 URL 并获取最多 X 字节的最佳方法是什么？

2024-02-26

我想让机器人每小时获取一个 URL，但如果网站运营商是恶意的，他可以让他的服务器向我发送一个 1 GB 的文件。有没有好的方法可以将下载限制为 100 KB，并在该限制之后停止？

我可以想象从头开始编写自己的连接处理程序，但如果可能的话，我想使用 urllib2，只是以某种方式指定限制。

Thanks!

这可能就是您正在寻找的：

import urllib

def download(url, bytes = 1024):
    """Copy the contents of a file from a given URL
    to a local file.
    """
    webFile = urllib.urlopen(url)
    localFile = open(url.split('/')[-1], 'w')
    localFile.write(webFile.read(bytes))
    webFile.close()
    localFile.close()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

http

URL

Sockets

在 Python 中打开 URL 并获取最多 X 字节的最佳方法是什么？的相关文章

查找 python 数据框中每行的最高值

我想找到每行中的最高值并返回 python 中该值的列标题例如我想找到每行的前两个 df A B C D 5 9 8 2 4 1 2 3 我希望我的输出看起来像这样 df B C A D 您可以使用字典理解来生成largest n数据帧
使用 Python 的 optparse 模块时如何遵守 PEP 257 文档字符串？

根据PEP 257 http www python org dev peps pep 0257 multi line docstrings命令行脚本的文档字符串应该是它的使用消息脚本的文档字符串 a 独立程序应该可用作为其使用消息
如何使用 boto3 从 AWS Cognito 获取经过身份验证的身份响应

我想使用 boto3 获取访问 AWS 服务的临时凭证用例是这样的我的 Cognito 用户池中的用户登录到我的服务器我希望服务器代码为该用户提供访问其他 AWS 服务的临时凭证我有一个存储我的用户的 Cognito 用户池我有一
[python]没有属性“TessBaseAPI”

当我编译代码时出现错误 import tessercat api tesseract TessBaseAPI 错误是 AttributeError 模块对象没有属性 TessBaseAPI 我已经安装了tesseract via pip
导入错误：没有名为“wordcloud”的模块

我正在努力将 wordcloud 安装到我的环境中这是我正在运行的代码 import os import matplotlib pyplot as plt from wordcloud import WordCloud 我收到以下错误 I
为什么我不能“string”.print()？

我的理解print 在 Python 和 Ruby 以及其他语言中它是字符串或其他类型上的方法因为它的语法非常常用打印嗨 works 那么为什么不呢 hi print 在 Python 中或 hi print在红宝石工作当你
来自数据框 groupby 的条形图

import pandas as pd import numpy as np import matplotlib pyplot as plt df pd read csv arrests csv df df replace np nan 0
如何将一串Python代码编译成一个可以调用函数的模块？

在 Python 中我有一串 Python 源代码其中包含以下函数 mySrc def foo print foo def bar print bar 我想将这个字符串编译成某种形式类似模块的对象这样我就可以调用代码中包含的函数这是我
如何将字符串方法应用于数据帧的多列

我有一个包含多个字符串列的数据框我想使用对数据帧的多列上的系列有效的字符串方法我希望这样的事情 df pd DataFrame A 123f 456f B 789f 901f df Out 15 A B 0 123f 789f 1 45
在Python中确定句子中2个单词之间的邻近度

我需要确定 Python 句子中两个单词之间的接近度例如在下面的句子中 the foo and the bar is foo bar 我想确定单词之间的距离foo and bar 确定之间出现的单词数foo and bar 请注意该词
如何将列表中的每个项目转换为字符串，以便连接它们？ [复制]

这个问题在这里已经有答案了我需要加入一个项目列表列表中的许多项目都是从函数返回的整数值 IE myList append munfunc 我应该如何将返回的结果转换为字符串以便将其加入列表我是否需要对每个整数值执行以下操作 myLis
Learning_rate 不是合法参数

我正在尝试通过实现 GridSearchCV 来测试我的模型但我似乎无法在 GridSearch 中添加学习率和动量作为参数每当我尝试通过添加这些代码来执行代码时我都会收到错误这是我创建的模型 def define model op
如何让 Python 找到 ffprobe？

I have ffmpeg and ffprobe安装在我的 mac macOS Sierra 上并且我已将它们的路径添加到 PATH 中我可以从终端运行它们我正在尝试使用ffprobe使用以下代码获取视频文件的宽度和高度 impor
如何从外语线程调用Python函数（C++）

我正在开发一个程序使用 DirectShow 来抓取音频数据媒体文件 DirectShow 使用线程将音频数据传递给回调我的程序中的函数然后我让该回调函数调用另一个函数 Python 中的函数我使用 Boost Python 来包
单击 selenium 中的链接时循环遍历表格的行（python）

示例页面源代码如下所示 div class div1 table class foot market tbody td class today name td tbody tbody td class today name td tbody
为什么 tesseract 无法从这个简单的图像中读取文本？

我在 pytesseract 上阅读了大量的帖子但我无法让它从一个简单的图像中读取文本它返回一个空字符串这是图像我尝试过缩放它灰度化它调整对比度阈值模糊以及其他帖子中所说的一切但我的问题是我不知道 OCR 想要更好地工作
Python中的MariaDB连接器无法连接到远程服务器

我使用与远程 Mariadb 服务器的连接已有几个月了今天无法再通过 macOS 上的 python mariadb 模块和 mariadb 连接器建立连接基本安装如下 brew install mariadb connector c
如何有效地计算另一列中每个元素的较大元素的数量？

我有以下内容df name created utc 0 t1 cqug90j 1430438400 1 t1 cqug90k 1430438400 2 t1 cqug90z 1430438400 3 t1 cqug91c 143043840
使用 Python 进行 Google 搜索网页抓取 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案最近为了工作中的一些项目学习了很多python 目前我需要使用谷歌搜索结果进行一些网络抓取我发现几
将字典写入 csv 时遇到问题，其中键作为标题，值作为列

我有一本字典看起来像 mydict foo 1 2 bar 3 4 asdf 5 6 我正在尝试将其写入 CSV 文件使其看起来像 foo bar asdf 1 3 5 2 4 6 我花了最后一个小时寻找解决方案我发现的最接近的解决方

随机推荐

如何强制 Grails 仅使用一种语言？

我想让我的 Grails 应用程序仅支持一种语言我可以在某处定义该语言完全忽略客户端的标头或 lang 参数我有什么办法可以这样做吗谢谢定义一个LocaleResolver豆子在你的config spring resources
我可以将 MVC 2 DataAnnotation 属性添加到现有属性吗？

我使用生成的类作为模型并且希望将 DataAnnotation 属性添加到其某些属性由于它是生成的代码我不想直接添加注释还有其他方法可以将它们附加到财产上吗我考虑过使模型成为一个接口并使用分部类来获取生成的类来订阅它假设可行的
iOS 5 SDK 以不同方式对待 UIView

我的应用程序曾经在 xCode 4 0 2 中完美编译但现在不再使用新 SDK 在 xCode 4 2 中正确编译我的模态视图的工作方式非常不同某些状态未被检测到或者其他解雇不起作用例如它可以用来消除 2 个堆叠的模态视图 if
React Native：用选项卡动画缩小标题

Goal 我试图创建一个带有动画收缩标题的视图其中包含带有滚动内容的选项卡的选项卡视图参见图片 Setup 我正在使用带有 TabNavigator 的反应导航 header 是一个具有固定高度的组件当前位于 TabNavigator
使用 googletest 测试受保护成员

谷歌测试时我对继承感到困惑我有一个class A具有protected属性如果我想访问那些我必须扩展该类但同时我也需要扩展public testing Test唯一的目的是gtest 这个问题最优雅的解决方案是什么我也在努力避免 d
错误：1210：执行准备好的语句的参数数量不正确

我正在尝试使用 Python 将数据插入 MySQL 出现这个错误的原因是什么编程错误 1210 执行的参数数量不正确准备好的声明我的Python代码 connection mysql connector connect host l
UISearchController 搜索栏在第一次单击时消失

我在 TableView 中实现了 UISearchController 由导航控制器推动首先我的问题是每当我单击搜索栏时它就会消失当我输入一些文本时它起作用但它保持完全空白然后我设法使用以下代码半解决了该问题 void sea
对 ASP.NET Core 中缺少必需属性的响应

给定以下控制器 using System ComponentModel DataAnnotations using Microsoft AspNetCore Mvc namespace WebApplication1 Controllers
Scala 中未绑定的可比较排序

我对 Scala 中的排序有点熟悉Ordering的但是我想对 Java 中定义的一些对象进行排序他们是Comparable not Comparable T and final final class Term implements
Slug 大小对于 Heroku 上的 Flask 应用程序来说太大

我正在部署一个非常简单的烧瓶应用程序带有面部识别模型我只是将 Flask 应用程序代码和模型权重推送到 Heroku 我的 slug 大小仍然是 556M 超过了 500M 的限制我在requirements txt 中有最低要求这
为什么从返回 int32_t 的函数返回 0x80000000 不会导致警告？

考虑 int32 t f return 0x80000000 为什么这不会导致编译器警告至少在 GCC 上 0x80000000 超出范围int32 t INT32 MAX is 0x7fffffff 我相信这应该会导致隐式转换这是正确
在 AWS Lambda 函数中使用 Django ORM

我有一个现有的 Django 应用程序数据存储在 Postgres RDS 下现在我想通过 lambda AWS 函数和 Django 风格的 ORM 查询更新数据我知道理论上这是可能的如果使用 lambda 函数打包整个 Dja
如何进行水平视差滚动

我正在使用最新版本的 Bootstrap JQuery 和 Skrollr 我想要一个静态背景和几个在您通过视差滚动滚动时出现的场景我可以在您滚动时制作场景但我正在寻找一种方法让您看起来不会向下移动页面我正在寻找像这样的图像的场景
使用 BigQuery 查询地理空间数据

您好我想获取基于 GPS 坐标的公共场所餐厅酒店电影院等邻居列表 BigQuery 可以做到这一点吗如果您将经纬度或 GPS 坐标作为列那么您绝对可以使用坐标上的 WHERE 比较从 BigQuery 中获取矩形区域然后在选
在 Windows 10 中找不到 tools.jar React Native Android

伙计们我只是尝试在我的笔记本电脑上安装 React Native 我已遵循所有设置说明但仍然收到这些错误 What went wrong Execution failed for task app compileDebugJavaWit
使用训练有素的 Spark ML 模型提供实时预测[重复]

这个问题在这里已经有答案了我们目前正在测试一个基于 Spark 在 Python 中实现 LDA 的预测引擎 https spark apache org docs 2 2 0 ml clustering html latent diri
如何使用堆在线性时间内找到数字的中位数？

维基百科 http en wikipedia org wiki Heap data structure Heap applications says 选择算法找到最小值最大值最小值和最大值 median 或者甚至第 k 大元素也可以
在Windows中设置子进程名称？

我有一个进程它运行多次子进程每个子进程都没有 GUI 并且需要为任务管理器的所有子进程设置不同的名称和描述可以使用Win API吗我找不到 Windows 系列的解决方案我查看了 WriteProcessMemory 但它看
使用 JavaScript 的 Selenium Webdriver，如何使用 chrome.exe 的特定路径启动 Chrome？

我有以下 Javascript 代码它使用由指定的 Chrome 路径启动 ChromePATH环境变量 let driver await new Builder forBrowser chrome build 如何使用 Chrome 的
在 Python 中打开 URL 并获取最多 X 字节的最佳方法是什么？

我想让机器人每小时获取一个 URL 但如果网站运营商是恶意的他可以让他的服务器向我发送一个 1 GB 的文件有没有好的方法可以将下载限制为 100 KB 并在该限制之后停止我可以想象从头开始编写自己的连接处理程序但如果可能的话我想

在 Python 中打开 URL 并获取最多 X 字节的最佳方法是什么？

在 Python 中打开 URL 并获取最多 X 字节的最佳方法是什么？ 的相关文章

随机推荐

热门标签

在 Python 中打开 URL 并获取最多 X 字节的最佳方法是什么？的相关文章