ValueError:数组太大

2024-02-03

我试图使用以下代码合并两个Excel文件并遇到以下错误ValueError: array is too big; arr.size * arr.dtype.itemsize is larger than the maximum possible size.

import pandas as pd

file1 = pd.read_excel("file1.xlsx")
file2 = pd.read_excel("file2.xlsx")

file3 = file1.merge(file2, on="Input E-mail", how="outer")

file3.to_excel("merged1.xlsx")

文件大小为 ~100MB+~100MB,可用 RAM 为 9GB(16GB)


您生成的数据框可能比您的两个输入数据框大得多。简单的例子:

import pandas as pd

values = pd.DataFrame({"id": [1,1,1,1], "value": ["a", "b", "c", "d"]})

users = pd.DataFrame({"id": [1,1,1], "users": ["Amy", "Bob", "Dan"]})

big_table = pd.merge(users, values, how="outer")

print big_table

Result:

     id  users    value
0     1   Amy       a
1     1   Amy       b
2     1   Amy       c
3     1   Amy       d
4     1   Bob       a
5     1   Bob       b
6     1   Bob       c
7     1   Bob       d
8     1   Dan       a
9     1   Dan       b
10    1   Dan       c
11    1   Dan       d
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ValueError:数组太大 的相关文章

随机推荐

  • iOS JSON 数组和 MapKit

    我正在尝试使用 MapKit 映射 JSON 数组 我可以使用下面的代码在地图上获得一个点 但是我有几十个需要标记的引脚 并且我准备了一个 JSON 数组 我的单点代码如下 在我的 h 文件中 import
  • 生成随机证书

    我正在寻找一个实用程序类 它可以生成用于测试目的的随机证书字符串 知道是否已经实施了吗 要添加到 martijno 给出的解决方案中 JCAContentSigner 可用于避免映射到 AlgorithmIdentifier 即 OID 而
  • 如何在 Objective C (iphone) 中通过引用传递值

    我有一个非常基本的问题 我是一名新 iPhone 程序员 我的问题是任何人都可以告诉我如何通过引用 obj 中的函数来传递值 C 我知道如何用 VB 和 C 来做 但不知道如何在 Obj c 中做到这一点 Thanks Objective
  • angular2 rc6:RouterState类型上不存在属性queryParams

    通往 Angular 2 Final 之路上的另一个 立即弃用错误 错误消息很清楚 我现在只需要知道相应的字段叫什么即可 有人吗 RouterState 类型上不存在属性 queryParams 以为我解决了 属性 queryParams
  • 根据单独的对象键、值过滤对象数组

    我有以下一组人 const FIRST ARRAY name Simon age 32 occupation Student name Vera age 22 occupation Developer 我想过滤数组以生成基于 过滤器 对象的
  • SQLException.getSQLState 的所有可能值是什么?

    SQLException getSQLState检索SQLState为了SQLException目的 此方法可以返回哪些可能的值 我可以使用该值来识别数据库中发生的特定错误 即该值可以告诉我它是否是 PK 违规 唯一约束或列值太大等 另外
  • iOS/OSX 应用程序组 ID,以“group”开头。或“团队 ID”。

    在配置门户 或现在的任何名称 中创建应用程序组 ID 时 它会显示 输入应用程序组的唯一标识符 以字符串 组 开头 并且似乎在输入字段中强制执行此操作 此外 许多示例代码使用应用程序组 ID 字符串 例如 group com company
  • 在 Powershell 控制台中使用 CTRL + D 退出并使用 CTRL + L cls

    我正在努力使 CTRL D exit Powershell console and CTRL L clear the screen 就像在 bash 中一样 到目前为止 我已经看到我们可以定义 function D exit 但这意味着我必
  • GWT 编辑器框架

    有没有办法获取编辑器正在编辑的代理 正常的工作流程是 public class Class implments Editor
  • 寻找张量的质心(张量流)

    有没有一种有效的方法来找到张量的质心 我正在使用 N 个堆叠体积 Nx64x64x64 并希望获得一个 Nx3 张量 其中包含每个 64x64x64 体积的质心的 x y z 位置 按照公式 您只需将每个坐标乘以相应的质量 将所有内容相加
  • 如何将位图照片转换为十六进制颜色代码?

    我正在尝试为我的简历创建一个程序 但我在转换时遇到问题bitmap照片就是灰度照片转为十六进制 或者更好地称之为代码 如果颜色 有人可以帮助我吗 我尝试将其转换为Base64字符串但它不起作用 openFileDialog1 new Ope
  • 将 Cordova 插件与 Capacitor 结合使用

    我一直在研究这个例子 https capacitor ionicframework com docs basics cordova https capacitor ionicframework com docs basics cordova
  • 给定 2 个整数列表,如何找到不重叠的范围?

    Given x 5 30 58 72 y 8 35 53 60 66 67 68 73 目标是迭代x i并找到值y那大于x i但不大于x i 1 假设两个列表都已排序并且所有项目都是唯一的 给定所需的输出x and y is 5 8 30
  • 如何在 DB2 9.5 中计算 MD5 哈希值

    DB2 9 5 中是否有可用的函数 包来计算 MD5 哈希值 和Oracle类似的东西DBMS OBFUSCATION TOOLKIT MD5 没有内置函数可以执行此操作 但您当然可以创建自己的用户定义函数 UDF 这篇 Developer
  • Spark Streaming 应用程序失败并出现 KafkaException:字符串超出最大大小或出现 IllegalArgumentException

    TL DR 我非常简单的 Spark Streaming 应用程序在驱动程序中失败 并显示 KafkaException 字符串超出最大大小 我在执行程序中看到了相同的异常 但我还在执行程序日志的某处发现了 IllegalArgumentE
  • 存储实体的更改:MySQL 是正确的解决方案吗?

    我想存储我在 实体 表上所做的更改 这应该像一个日志 目前MySQL中是用这张表实现的 CREATE TABLE entitychange id int 11 unsigned NOT NULL AUTO INCREMENT entity
  • 上下文菜单触发器未在 TreeViewItem 上触发

    在我的 WPF 应用程序中 我添加了一个 TreeView 控件 将类数据绑定到 TreeViewItems 我已将上下文菜单添加到树视图项目中 contextMenu 的处理程序未触发 以下是 TreeView 的 XAML 代码
  • 基于 HAProxy 中的上下文路径动态路由到后端

    我有具体要求 根据我的上下文路径 我必须通过 HAProxy 将流量重定向到不同的服务器 端口 我已经通过 ACL 中的 path beg 实现了相同的效果 下面是配置 use backend a1 if path beg a1 use b
  • 如何在 Jupyter 笔记本中包装代码/文本

    我正在使用 jupyter notebooks 进行 python 编码 有没有办法将文本 代码包装在 jupyter 笔记本代码单元中 下面提供图片 换行文本意味着 文本如何在 MS word 中换行 通过找到您的配置目录jupyter
  • ValueError:数组太大

    我试图使用以下代码合并两个Excel文件并遇到以下错误ValueError array is too big arr size arr dtype itemsize is larger than the maximum possible s