如何在 RESTful Flask 应用程序中将 Pandas DataFrame 与 ProtoBuf/Gzip 进行序列化/反序列化？

2024-05-01

我有一个pandas dataframe作为Flask Response对象在一个flask应用。目前我正在将其转换为JSON Object,

df = df.to_json()
return Response(df, status=200, mimetype='application/json')

数据帧的大小确实非常巨大，可能有 5000000 X 10。在客户端，当我将其反序列化为，

df = response.read_json()

正如我的数量URL request parameters成长, 的dataframe也会成长。反序列化时间增长linear factor与我想避免的序列化相比。例如：Serialization需要15-20秒，deserialization需要 60-70 秒。

有没有办法protobuf在这种情况下可以帮助将 pandas 数据帧转换为 protobuf 对象。还有一种方法可以发送这个JSON as Gunzipped通过烧瓶模仿类型？我相信两者之间的时间安排和效率具有可比性protobuf and gunzip.

在这种情况下最好的解决方案是什么？

提前致谢。

我最近遇到了同样的问题。我通过迭代 DataFrame 的行并使用 DataFrame 中的信息在该循环中调用 protobuf_obj.add() 来解决这个问题。然后，您可以对序列化字符串输出进行 GZIP。

即：

for _, row in df.iterrows():
    protobuf_obj.add(val1=row[col1], val2=row[col2])
proto_str = protobuf_obj.SerializeToString()
return gzip.compress(proto_str)

鉴于这个问题在 9 个月内还没有得到解答，我不确定是否有更好的解决方案，但如果有的话，我绝对愿意听取一个解决方案！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 RESTful Flask 应用程序中将 Pandas DataFrame 与 ProtoBuf/Gzip 进行序列化/反序列化？的相关文章

Kivy - 有所有颜色名称的列表吗？

在 Kivy 中小部件 color属性允许输入其值作为字符串颜色名称也例如在 kv file Label color red 是否有所有可能的颜色名称的列表就在这里来自Kivy 的文档 https kivy org doc sta
Python 2.7 中的断言对我来说不起作用示例assertIn

我的 Mac 上安装了 python 2 7 通过在终端中运行 python v 进行验证当我尝试使用任何新的 2 7 断言方法时我收到 AtributeError 我看过http docs python org 2 library u
工作日重新订购 Pandas 系列

使用 Pandas 我提取了一个 CSV 文件然后创建了一系列数据来找出一周中哪几天崩溃最多 crashes by day bc DAY OF WEEK value counts 然后我将其绘制出来但当然它按照与该系列相同的排名顺序绘制
如果未引发异常，则通过 Python 单元测试

在Python中unittest框架是否有一种方法可以在未引发异常的情况下通过单元测试否则会因 AssertRaise 而失败如果我正确理解你的问题你could做这样的事情 def test does not raise on va
没有名为 StringIO 的模块

我有Python 3 6 我想从另一个名为 run py 的 python 文件执行名为 operation py 的 python 文件 In operation py I do from cStringIO import StringI
在 Django OAuth Toolkit 中安全创建新应用程序

如何将 IsAdminUser 权限添加到 Django OAuth Toolkit 中的 o applications 视图 REST FRAMEWORK DEFAULT PERMISSION CLASSES rest framework
Emacs 24.x 上的 IPython 支持

我对 IPython 与 Emacs 的集成感到困惑从 Emacs 24 开始 Emacs 附带了自己的python el 该文件是否支持 IPython 还是仅支持 Python 另外维基百科 http emacswiki org e
从扫描文档中提取行表 opencv python

我想从扫描的表中提取信息并将其存储为 csv 现在我的表提取算法执行以下步骤应用倾斜校正应用高斯滤波器进行去噪使用 Otsu 阈值进行二值化进行形态学开局 Canny 边缘检测进行霍夫变换以获得表格行去除重复行 10像素范围内相
Django 的 request.FILES 出现 UnicodeDecodeError

我在视图调用中有以下代码 def view request body u for filename f in request FILES items body body Filename filename n f read n 在某些情况下
在 Windows 上使用 apache mod_wsgi 运行 Flask 应用程序时导入冲突

我允许您询问我在 Windows 上使用您的 mod wsgi portage 托管 Flask 应用程序时遇到的问题我有两个烧瓶应用程序由于导入冲突只有一个可以同时存在 IE 如果请求申请 1 我有回复然后如果我请求应用程序 2
pytest：同一接口的不同实现的可重用测试

想象一下我已经实现了一个名为的实用程序可能是一个类 Bar在一个模块中foo 并为其编写了以下测试测试 foo py from foo import Bar as Implementation from pytest import ma
Geodjango距离查询未检索到正确的结果

我正在尝试根据地理位置的接近程度来检索一些帖子正如您在代码中看到的我正在使用 GeoDjango 并且代码在视图中执行问题是距离过滤器似乎被完全忽略了当我检查查询集上的距离时我得到了预期距离 1m 和 18km 但 18km 的帖
用 python 编写的数学语法检查器

我需要的只是使用 python 检查字符串是否是有效的数学表达式为了简单起见假设我只需要运算符也作为一元带有数字和嵌套括号为了完整性我还添加了简单的变量名称所以我可以这样测试 test 3 2 1 valid test 3
PHP 中的简单 JSON 请求

我有以下 json country code latitude 45 9390 longitude 24 9811 zoom 6 address city country Romania country code RO region 我只想
如何与其他用户一起使用 pyenv？

如何与其他用户一起使用 pyenv 例如如果我在用户 test 的环境中安装了 pyenv 则当我以 test 身份登录时可以使用 pyenv 但是当我以其他用户例如 root 身份登录时如何使用 pyenv 即使你这么做了我也会s
双击打开 ipython 笔记本

相关文章通过双击 osx 打开 ipython 笔记本 https stackoverflow com questions 16158893 open an ipython notebook via double click on osx
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此
多个对象以某种方式相互干扰[原始版本]

我有一个神经网络 NN 当应用于单个数据集时它可以完美地工作但是如果我想在一组数据上运行神经网络然后创建一个新的神经网络实例以在不同的数据集甚至再次同一组数据上运行那么新实例将产生完全错误的预测例如对 XOR 模式进行训练
使用ssl和socket的python客户端身份验证

我有一个 python 服务器需要客户端使用证书进行身份验证我如何制作一个客户端脚本使用客户端证书由 python 中的服务器使用 ssl 和套接字模块进行身份验证有没有仅使用套接字和 ssl 而不扭曲的示例 from OpenSS
Apache Beam Pipeline 写表后查询表

我有一个 Apache Beam Dataflow 管道它将结果写入 BigQuery 表然后我想查询该表以获取管道的单独部分但是我似乎无法弄清楚如何正确设置此管道依赖性我编写的新表然后想要查询与一个单独的表连接以进行某些过滤

随机推荐

在 lldb 中的“NSMutableArray *”PO 命令类型的对象上找不到属性“count”

我正在使用控制台po一些变量在这种情况下我有一个NSMutableArray 我想看看它的计数我收到一个奇妙的错误有任何想法吗我知道我可以看到变量列表中的计数它说 1个对象但我在使用时似乎对多个获取器和属性有这个错误po 更新
需要选定值的 jquery 自动完成字段？

我需要一些 jquery 插件因为他们在大多数航班预订网站上使用它您必须从组合列表中选择出发到达机场我环顾四周但找不到任何好的解决方案我需要一个自动完成组合框它将保持打开状态直到用户从可能值列表中选择一个项目并且它必须支持
如何在 Github Action 中使用 Github 发布版本号

我创建了一个 Github 存储库其中包含构建 npm 包并将其发布到 npmjs com 的操作我的行动的触发因素是在 Github 上创建一个新版本创建新版本时 Github 要求我提供版本号我很想在操作中使用这个版本号并将其提
编码java Cookie值

应如何对 Java Cookie 对象的实际值进行编码我无法传递等字符或 US ASCII 之外的任何字符 Br 乔因斯如何并不重要但通常Base64 http en wikipedia org wiki Base64应该可以正常工
列出共享邮箱上的所有电子邮件及其附件名称

我创建了一个非常简单的 powershell 脚本来收集有关共享邮箱文件夹上所有电子邮件的一些基本信息 Add type assembly Microsoft Office Interop Outlook out null olFolder
Xcode 8 配置文件无法下载

I recently updated to Xcode 8 and as I click on download option next to provisioning profile in Xcode Preferences Accoun
如何从 Visual Studio 代码中的窗口标题中删除新的搜索栏？

VSCode 版本 1 81 0 macOS 版本 Ventura 13 2 1 使用的主题 Material 主题过去这只是没有箭头图标的文本如何恢复旧的视觉效果和行为我永远不会单击此按钮来激活与 CMD P 相同的窗口右键单击搜
通过私钥使用 Python 进行 SSH

在我的脚本中我需要使用私钥通过 SSH 连接到远程系统并将文件转储到其目录中我用来 SSH 进入系统的命令是这样的 ssh i private key localhost 接下来是标准输入输入密钥 private key 的密码我
反编译 C# .Net 1.1 应用程序的最佳工具 [重复]

这个问题在这里已经有答案了可能的重复 net 反汇编器反编译器 https stackoverflow com questions 578883 a net disassembler decompiler 是否有 NET Reflect
Google Drive：如何使用 Python SDK 转让所有权？

我设置了一个服务帐户来复制用户上传的文件如何将所有权转移到其他电子邮件地址 I have new permission value email protected cdn cgi l email protection type user
如何在Qt WebKit中将网页保存为“另存为完整网页”

我需要使用 Qt WebKit 保存网页类似于另存为完整网页以下是我的要求保存索引html文件维护实体编码需要下载所有链接的图像和其他资源需要将html页面中的资源路径更改为本地下载路径需要维护网页当前状态我可以使用 Qt
如何在 WPF ComboBox 中为下拉列表值/所选项目显示不同的值？

我有一个 WPF 组合框绑定到具有长描述的项目列表绑定到 ComboBox 的类型具有短描述和长描述作为属性目前我受完整描述的约束 comboBox DisplayMemberPath FullDescription 如何确保当项目
如何在 hypercorn 或 uvicorn 等 ASGI 服务器上运行 Windows IIS？

我有一个用 python 编写的基于 api 的 Web 应用程序FastApi https fastapi tiangolo com 它使用Uvicorn https www uvicorn org or 超级玉米 https pgjon
如何在不污染全局命名空间的情况下公开 javascript 对象以进行单元测试

我有一个 javascript 自动完成插件它使用以下类用咖啡脚本编写查询建议建议集合和自动完成每个类都有一个用 Jasmine 编写的相关规范该插件在模块中定义例如 function plugin call this 这可
Android更改ListView字体

似乎是一个简单的问题但由于我是 Android 开发新手所以我对 Android ListViews 知之甚少以下是我在项目中用于 ListView 的代码 Listview code starts mainListView List
如何将 NSString 转换为 NSArray [重复]

这个问题在这里已经有答案了我有一个像这样的字符串 NSString str 90 5 6 我需要将其转换为数组例如 NSArray numbers 90 5 6 我做了很长一段路是这样的 NSArray stringToArray NS
LibXML2 中有“二进制转储”或“获取二进制表示”功能吗？

我需要访问已加载的 XML DOM 的内部二进制表示形式有一些转储功能 http xmlsoft org html libxml tree html 但我没有看到类似二进制缓冲区的内容只有 XML 缓冲区我的最后一个目标是逐字节比
如何处理.net MVC Core中的动态错误页面？

目前我有 app UseExceptionHandler Home Error 我想让路径相对于原始路径例如如果 Tenant1 PageThatThrowsError 然后 app UseExceptionHandler Tenant1
使用express和marked返回渲染的markdown

因此我正在运行一个小型测试应用程序以在访问路线时返回 html 中的 markdown 文件的内容我正在使用标记来呈现降价 https github com chjj marked https github com chjj mark
如何在 RESTful Flask 应用程序中将 Pandas DataFrame 与 ProtoBuf/Gzip 进行序列化/反序列化？

我有一个pandas dataframe作为Flask Response对象在一个flask应用目前我正在将其转换为JSON Object df df to json return Response df status 200 mimet

如何在 RESTful Flask 应用程序中将 Pandas DataFrame 与 ProtoBuf/Gzip 进行序列化/反序列化？

如何在 RESTful Flask 应用程序中将 Pandas DataFrame 与 ProtoBuf/Gzip 进行序列化/反序列化？ 的相关文章

随机推荐

热门标签

如何在 RESTful Flask 应用程序中将 Pandas DataFrame 与 ProtoBuf/Gzip 进行序列化/反序列化？的相关文章