在 Python 中通过 HTTP 将未知大小的数据从客户端流式传输到服务器

2023-11-23

不幸的是，我之前的问题因是问题的“精确副本”而被关闭，而它绝对不是，特此再次。

它不是重复的Python：HTTP 使用流式传输大文件

那个处理的是大文件的流传输；我想将文件的任意块一一发送到同一个 http 连接。所以我有一个 20 MB 的文件，我想要做的是打开一个 HTTP 连接，然后发送 1 MB，再发送 1 MB，依此类推，直到完成。使用相同的连接，因此服务器会看到该连接上出现 20 MB 的块。

映射文件也是我打算做的，但是当从标准输入读取数据时，这不起作用。主要针对第二种情况，我正在寻找这种逐部分的数据馈送。

老实说，我想知道是否可以完成 - 如果不能，我想知道，然后可以关闭该问题。但如果可以做到的话，又该如何做到呢？

从客户的角度来看，这很容易。您可以使用httplib的低级接口——putrequest, putheader, endheaders, and send—以任意大小的块将您想要的任何内容发送到服务器。

但您还需要指出文件的结束位置。

如果您事先知道文件的总大小，则可以简单地包括Content-Lengthheader，服务器将在这么多字节后停止读取您的请求正文。代码可能如下所示。

import httplib
import os.path

total_size = os.path.getsize('/path/to/file')
infile = open('/path/to/file')
conn = httplib.HTTPConnection('example.org')
conn.connect()
conn.putrequest('POST', '/upload/')
conn.putheader('Content-Type', 'application/octet-stream')
conn.putheader('Content-Length', str(total_size))
conn.endheaders()
while True:
    chunk = infile.read(1024)
    if not chunk:
        break
    conn.send(chunk)
resp = conn.getresponse()

如果您事先不知道总大小，则理论答案是分块传输编码。问题是，虽然它广泛用于响应，但对于请求来说似乎不太受欢迎（尽管定义也很好）。库存 HTTP 服务器可能无法开箱即用地处理它。但是，如果服务器也在您的控制之下，您可以尝试手动解析请求正文中的块并将它们重新组装到原始文件中。

另一种选择是将每个块作为单独的请求发送（使用Content-Length）通过同一连接。但您仍然需要在服务器上实现自定义逻辑。此外，您需要在请求之间保留状态。

2012 年 12 月 27 日添加。有一个 nginx 模块将分块请求转换为常规请求。只要您不需要真正的流式传输（在客户端发送完请求之前开始处理请求），这可能会有所帮助。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Python 中通过 HTTP 将未知大小的数据从客户端流式传输到服务器的相关文章

在 Python 中使用 Selenium 处理“接受 Cookie”弹出窗口

我一直在尝试用硒抓取这个房地产网站的一些信息但是当我访问该网站时我需要接受 cookie 才能继续这仅在机器人访问网站时发生而不是在我手动执行时发生当我尝试通过 xpath 或 id 查找相应的元素时正如我在手动检查页面时找到
on_delete=models.PROTECT 和 on_delete=models.CASCADE 在 Django 模型上有什么作用？

我对 Django 很熟悉但最近注意到有一个on delete models CASCADE and on delete models PROTECT模型的选项 on delete models CASCADE and on delete
python - 是否可以扩展 xml-rpc 可以序列化的事物集？

我看到几个问题询问如何发送numpy ndarray通过 xml rpc 调用这不能开箱即用因为正如 xml rpc 中所述docs https docs python org 2 library xmlrpclib html 有一组固
可以在 TensorFlow 中使用排名相关作为成本函数吗？

我正在处理偶尔充满异常值的极其嘈杂的数据因此我主要依靠相关性来衡量我的神经网络的准确性是否可以明确使用诸如等级相关性斯皮尔曼相关系数之类的东西作为我的成本函数到目前为止我主要依赖 MSE 作为相关性的代理我现在面临三个主要障碍
带图像的简单 GUI [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我试图在简单的 GUI 上显示一些卡
错误：permission_manager_qt.cpp(82) 不支持的权限类型：13

我正在开发具有内置浏览器功能的 python 代码 PyQt 5 13 import sys from PyQt5 QtCore import from PyQt5 QtGui import from PyQt5 QtWidgets imp
如何从 Dockerfile 安装 Python 3.7 和 Pip

我正在尝试构建基于 Ubuntu 18 04 的自定义 Docker 映像 Ubuntu 预装了 Python 3 6 但我想 1 安装 Python 3 7 2 将其设置为默认 Python 版本这样就可以使用python代替pytho
Python Kivy - 在本机网络浏览器中打开 url 的应用程序

我尝试制作一个简单的应用程序在单击 Screen One 上的按钮后在 Kivy 中打开一个网页我使用了这个主题 Python 在应用程序中直接显示网络浏览器 iframe https stackoverflow com questi
在径向（树）网络x图中查找末端节点（叶节点）

给定下图是否有一种方便的方法来仅获取末端节点我所说的端节点是指那些具有一个连接边的到节点我认为这些有时被称为叶节点 G nx DiGraph fromnodes 0 1 1 1 1 1 2 3 4 5 5 5 7 8 9 10 ton
如何在python中检索aws批处理参数值？

流程 Dynamo DB gt Lambda gt 批处理如果将角色 arn 插入动态数据库它是从 lambda 事件中检索的然后使用submit job角色 arn 的 API 被传递为 parameters role arn ar
如何在Python和Selenium中通过标签名称或id获取元素[重复]

这个问题在这里已经有答案了我正在尝试使用 Python 和 Selenium 获取输入但它向我显示错误我该如何解决这个错误 inputElement send keys getStock getStocklFunc 0 Error i
Django 在选择列表更改时创建毫无意义的迁移

我正在尝试使用可调用创建一个带有选择字段的模型以便 Django 在选择列表更改时不会创建迁移如中所述this https stackoverflow com questions 31788450 stop django from cr
无法截取宽度为 0 的屏幕截图

我正在尝试截取 Bootstrap 模态内元素的屏幕截图经过一番努力我终于想出了这段代码 driver get https enlinea sunedu gob pe driver find element by xpath div c
Airflow Python 单元测试？

我想为我们的 DAG 添加一些单元测试但找不到任何单元测试有 DAG 单元测试框架吗有一个端到端的测试框架存在但我猜它已经死了 https issues apache org jira browse AIRFLOW 79 https
导入错误：没有名为 google.auth 的模块

当我尝试导入时firebase admin in python 2 7我收到错误导入错误没有名为 google auth 的模块这是Docker文件 https github com ammaratef45 Attendance bl
查找给定节点的最高权重边

我在 NetworkX 中有一个有向图边缘的权重从 0 到 1 表示它们发生的概率网络连通性非常高所以我想修剪每个节点的边缘只保留最高概率的节点我不确定如何迭代每个节点并仅保留最高权重in edges在图中有没有一个networ
为什么实现 __iter__ 的对象不被识别为可迭代的？

假设您使用包装对象 class IterOrNotIter def init self self f open tmp toto txt def getattr self item try return self getattribute
Python - 如何查询定义方法的类？

我的问题有点类似于this one https stackoverflow com questions 5520580 how do you get all classes defined in a module but not impor
如何禁止 celery 中的 pickle 序列化

Celery 默认使用 pickle 作为任务的序列化方法如中所述FAQ http ask github com celery faq html isn t using pickle a security concern 这代表一个安全漏
TypeError：无法使用抽象方法实例化抽象类 <...>

这是我的代码 from abc import ABC from abc import abstractmethod class Mamifiero ABC docstring for Mamifiero def init self self

随机推荐

如何控制Windows中的文件访问？

Go 提供os Chmod 用于设置文件和目录权限例如如果我想确保文件只能由当前用户访问我可以执行以下操作 os Chmod somefile txt 0600 这在 Linux 上工作得很好但在 Windows 上却毫无作用在深
com.google.android.youtube.api.jar.client.RemoteEmbeddedPlayer 中调用的构造函数引发异常

我已更改依赖项以导入 com android support appcompat v7 23 0 1 和 com android support design 23 0 1 但它无法修复错误 YouTube 片段显示初始化 Youtube
php spaceship 运算符如何比较字符串、数组和对象

我想知道 php spaceship 运算符如何比较字符串对象和数组例如下面的代码 echo Its Me at SO lt gt Its Me at SO 将返回 0 因为我知道所有字符都相同计数也相同但是如果我有如下代码 ec
如何在 svn 中正确地进行提交后分支并恢复主干？

我有一些提交事后决定将更多地进行分支工作而不是主干工作如何创建分支并恢复主干同时仍然确保以后合并不会很痛苦是否像将当前主干复制到分支并恢复主干一样简单或者这会导致以后头痛吗我认为飞利浦的方法将类似于以下内容假设最后一个良
使用 NHibernate 在同一 ASP.NET 应用程序中支持 Oracle 和 SQL Server 的建议

我们的客户希望在下一个项目中同时支持 SQL Server 和 Oracle 我们的经验来自 NET SQL Server 平台我们将雇用一名 Oracle 开发人员但我们关心的是 DataAccess 代码 NHibernate 会让
熊猫滚动窗口百分位排名

我正在尝试在滚动窗口内按列计算数据的百分位数排名 test pd DataFrame np random randn 20 3 pd date range 1 1 2000 periods 20 A B C test Out 111 A B
Google Chrome cookie 最长过期日期

当我使用以下 php 行创建一个新 cookie 时我正在创建我的网站 setcookie subscribed true time 365 24 3600 100 null false true 我意识到我的浏览器 Google Chr
使用 python 求解非方阵 A 的 Ax =b

我关注的是特殊情况A是一个 n x d 矩阵其中 k numpy 但是它们仅适用于方阵我采用了用一些线性独立向量填充矩阵以对其进行平方然后求解的方法但我无法弄清楚如何选择这些向量以便它们与基向量线性无关而且我认为它是这不是唯一
requestAnimationFrame 循环不正确 FPS

我有一个 javascript 函数我的游戏希望每秒循环 60 次用于控制输入绘图等目前的编码方式似乎始终在 52 左右明显低于 60 fps 甚至在没有其他事情发生时甚至会下降到 25 30 fps function loo
除了下面之外还有其他方法可以将 json.rows 文件加载到 RStudio 中吗？

我有一个 json rows 文件 gt instances json rows 大约有 223k 行我尝试使用 jsonlite 并想出了 instancesfile lt fromJSON instances json rows 但我
Typescript：从数组类型中检索元素类型信息

假设我有一些数组类型T 是否可以提取类型T在另一个别名接口中例如我的假的理想代码如下 for illustration only type ArrayElement
错误：[$compile:multidir] 多个指令 [form, form] 请求“form”控制器：

我在 angularjs 中构建的表单上收到此错误错误 compile multidir 多个指令 form form 请求 form 控制器 div ul li div job role div div job salary div d
运行 shell 脚本并立即将其置于后台，但保留检查其输出的能力

如何立即运行 shell 脚本背景但是它仍然可以通过尾随来随时检查其输出 tmp output txt 如果可以就好了前景这个过程太晚了 P S 如果您还可以向我展示如何将后台进程发送到可能已初始化或尚未初始化的 GNU 屏幕那就太
从 csv 文件中的数据创建多个 csv 文件

系统 OSX 或 Linux 我正在尝试自动化我的工作流程每周我都会收到一个 excel 文件我会将其转换为 csv 一个例子是 L1 L2 L3 L4 L5 L6 L7 L8 L9 L10 L11 Title r t needed a
为什么 Java 5+ API 不利用协变返回类型？

从 Java 5 开始我们可以协变返回类型为什么 Java API 不利用这一点呢 Take Graphics2D create 例如为什么不重写它来返回Graphics2D目的在我看来它在所有情况下都是向后兼容的总的来说这确
Mac OS X 上链接库的默认搜索目录是什么

我已经建立了谷歌测试在 Mac OS X 上使用 CMake 并获得两个共享库 libgtest dylib and libgtest main dylib 现在我需要安装它们我知道Linux上有一些默认的搜索目录例如 usr lib
在 Windows 中以编程方式确认打印成功

我的公司正在开发一个财务应用程序现在我们必须应对一项新法律该法律要求我们无论是否打印收据都采取不同的行动收据使用 Windows 中的标准打印队列在 A4 纸上的激光打印机上打印有没有办法以编程方式检查某个打印作业是否确实成功需要
日期格式化后以小写形式显示 AM 和 PM

格式化日期时间后时间以大写形式显示 AM 或 PM 但我希望它以小写形式显示例如 am 或 pm 这是我的代码 public class Timeis public static void main String s long ts 1
单个 EventMachine 反应器中的多个服务器

是否可以在单个事件机器中运行多个服务器我的意思是单个客户端连接可以同时使用多个服务例如登录服务器对用户进行身份验证然后用户可以通过单个客户端套接字同时使用聊天室和简单的游戏例如跳棋或者每个服务是否需要多个 eventmachin
在 Python 中通过 HTTP 将未知大小的数据从客户端流式传输到服务器

不幸的是我之前的问题因是问题的精确副本而被关闭而它绝对不是特此再次它不是重复的Python HTTP 使用流式传输大文件那个处理的是大文件的流传输我想将文件的任意块一一发送到同一个 http 连接所以我有一个 20 MB

在 Python 中通过 HTTP 将未知大小的数据从客户端流式传输到服务器

在 Python 中通过 HTTP 将未知大小的数据从客户端流式传输到服务器 的相关文章

随机推荐

热门标签

在 Python 中通过 HTTP 将未知大小的数据从客户端流式传输到服务器的相关文章