从（行、列、值）数据创建 Pandas DataFrame

2024-02-20

我有一个包含三列的 Pandas Dataframe：行、列、值。行值都是低于某些的整数N，并且列值都是低于某个值的整数M。这些值都是正整数。

如何有效地创建数据框N行和M列，带有 at 索引i, j价值val if (i, j , val)是我原始数据框中的一行，以及一些默认值（0）否则？此外，是否可以创建一个sparse立即Dataframe，因为数据已经相当大了，但是N*M仍然是我数据大小的 10 倍左右吗？

NumPy 解决方案适合这里的性能 -

a = df.values
m,n = a[:,:2].max(0)+1
out = np.zeros((m,n),dtype=a.dtype)
out[a[:,0], a[:,1]] = a[:,2]
df_out = pd.DataFrame(out)

样本运行 -

In [58]: df
Out[58]: 
    row  col  val
0     7    1   30
1     3    3    0
2     4    8   30
3     5    8   18
4     1    3    6
5     1    6   48
6     0    2    6
7     4    7    6
8     5    0   48
9     8    1   48
10    3    2   12
11    6    8   18

In [59]: df_out
Out[59]: 
    0   1   2  3  4  5   6  7   8
0   0   0   6  0  0  0   0  0   0
1   0   0   0  6  0  0  48  0   0
2   0   0   0  0  0  0   0  0   0
3   0   0  12  0  0  0   0  0   0
4   0   0   0  0  0  0   0  6  30
5  48   0   0  0  0  0   0  0  18
6   0   0   0  0  0  0   0  0  18
7   0  30   0  0  0  0   0  0   0
8   0  48   0  0  0  0   0  0   0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

sparsematrix

从（行、列、值）数据创建 Pandas DataFrame 的相关文章

美丽的汤从谷歌搜索中提取href

谷歌搜索给出了以下 HTML 的第一个结果 h3 class r a href https rads stackoverflow com amzn click com 0470284889 class l vst em Quantitati
帮助需要在可选条件下编写正则表达式[关闭]

我有一个日志文件包含如下内容 log Using data from yyyy mm dd 2011 8 3 0 files queued for scanning Warning E test H ndler pdf File not F
Pip install 导致此错误“ cl.exe' failed with exit code 2 ”

我已经阅读了有关此错误的所有其他问题但令人沮丧的是没有一个给出有效的解决方案如果我跑pip install sentencepiece在命令行中它给出了以下输出 src sentencepiece sentencepiece wra
将打开关闭的 Google Chrome 浏览器添加到 Selenium linkedin_scraper 代码中

我正在尝试抓取一些知名人士的 LinkedIn 个人资料该代码获取一堆 LinkedIn 个人资料 URL 然后使用Selenium and scrape linkedin收集信息并将其作为 json 文件保存到文件夹中我遇到的问题是
创建圆形图像 PIL Tkinter

Currently I have a zoom feature in my application that works very well however I d like the actual zoom box to be a circ
Python 使用 M2Crypto 通过 S/MIME 对消息进行签名

我现在花了几个小时但找不到我的错误我想要一个简单的例程来创建 S MIME 签名消息稍后可以与 smtplib 一起使用这是我到目前为止所拥有的 usr bin python2 7 coding utf 8 from future
在加载“cv2”二进制扩展期间检测到递归

我有一个小程序在 pyinstaller 编译后返回 opencv 错误但无需编译即可工作我在 Windows 10 上使用 Python 3 8 10 Program 导入 pyautogui将 numpy 导入为 np导入CV2
使用 Python 的文本中的词频但忽略停用词

这给了我文本中单词的频率 fullWords re findall r w allText d defaultdict int for word in fullWords d word 1 finalFreq sorted d iterit
Pyinstaller --onefile 警告文件已存在但不应存在

跑步时Pyinstaller onefile 并开始得到结果 exe 会出现多个弹出窗口并显示以下警告 WARNING file already exists but should not C Users myuser AppData L
向 Python 2.6 添加 SSL 支持

我尝试使用sslPython 2 6 中的模块但我被告知它不可用安装OpenSSL后我重新编译2 6 但问题仍然存在有什么建议么您安装了 OpenSSL 开发库吗我必须安装openssl devel例如在 CentOS 上在
在 MATLAB 中创建共享库

一位研究人员在 MATLAB 中创建了一个小型仿真我们希望其他人也能使用它我的计划是进行模拟清理一些东西并将其变成一组函数然后我打算将其编译成C库并使用SWIG https en wikipedia org wiki SWIG创建一
如何使用 msgpack 进行读写？

如何序列化反序列化字典data with msgpack http msgpack org The Python 文档 http msgpack python readthedocs io en latest badge latest似乎
如何从数据框的单元格中获取值？

我构建了一个条件从我的数据框中提取一行 d2 df df l ext l ext df item item df wn wn df wd 1 现在我想从特定列中获取一个值 val d2 col name 但结果我得到一个包含一行和一列
如何在matplotlib中基于x轴更改直方图颜色

我有根据 pandas 数据框计算出的直方图我想根据 x 轴值更改颜色例如 If the value is 0 the color should be green If the value is gt 0 the color shoul
如何在 Python 中执行相当于预处理器指令的操作？

有没有办法在 Python 中执行以下预处理器指令 if DEBUG lt do some code gt else lt do some other code gt endif There s debug 这是编译器预处理的特殊值 if
Flask SQLAlchemy 与 MyPy - 模型类型错误

我遇到了以下组合问题flask sqlalchemy and mypy 当我定义一个新的 ORM 对象时例如 class Foo db Model pass where db是使用创建的数据库SQL炼金术应用于flask app mypy
如何使用数据库在 Django 中的应用程序之间交换数据？

我正在使用 Django 在网络上工作我创建了 2 个应用程序第一个用于客户端注册并将其数据添加到数据库第二个应用程序供用户访问和查看交互界面这个想法是使用第二个应用程序从数据库中的客户端获取数据并使用它向用户显示一些信息我的问
使用 Flask-SQLAlchemy 进行多对多多数据库连接

我正在尝试使这个多对多联接与 Flask SQLAlchemy 和两个 MySQL 数据库一起工作并且它非常接近只是它为联接表使用了错误的数据库这是基础知识我有main db and vendor db 表格设置为main db u
对数据框的行进行排序

我有以下数据框 adjusted RFC df Node Feature Indicator Scaled Class Direction True False 0 0 km lt 0 181 class 4 0 gt 1 NA 125 1
网页抓取 - 如何识别网页上的主要内容

给定一个新闻文章网页来自任何主要新闻来源例如时报或彭博社我想识别该页面上的主要文章内容并丢弃其他杂项元素例如广告菜单侧边栏用户评论在大多数主要新闻网站上都可以使用的通用方法是什么有哪些好的数据挖掘工具或库最好是基于Py

随机推荐

TYPE_E_CANTLOADLIBRARY 仅当在 Windows 2003 x64 上的单独线程上使用 COM 对象时

我有一个访问 COM 对象的 Windows 窗体应用程序编译为 x86 它给了我以下错误 only在 Windows 2003 x64 上当代码在单独的线程上运行时创建 IDoc 期间出现异常无法将类型 PTISG COM Tek
修复 ARC 中潜在的内存泄漏

以下单例类 SharedManager 辅助方法可能会导致保留周期在静态分析器中收到警告在行分配的对象的潜在泄漏我该如何修复我确实尝试使 ivar uuid weak 但在分析时仍然出现警告 NSString weak uuid b
std::numeric_limits::epsilon() 可以用来做什么？

unsigned int updateStandardStopping unsigned int numInliers unsigned int totPoints unsigned int sampleSize double max hy
有没有办法阻止 contentEditable 元素在光标到达底部时滚动？

例如我有一个 contentEditable div 我可以在其中输入内容当文本到达 div 底部时浏览器会自动滚动 div 以便文本末尾和光标仍然可见如何防止 div 滚动以便输入的文本超出 div 的底部从而在键入时不再看到
将二维 ArrayList 复制为新的

所以我遇到的问题是在复制二维数组列表后更改一个二维数组列表中的元素会影响另一个二维数组列表我希望它们在内存中完全分开第一个示例展示了它如何正确处理一维数组列表 import java util ArrayList public cla
正则表达式匹配以测试有效年份

给定一个值我想验证它以检查它是否是有效的年份我的标准很简单其中值应该是整数4人物我知道这不是最好的解决方案因为几年前它不允许1000并将允许诸如5000 这个标准足以满足我当前的情况我想出的是 d 4 虽然这有效但它也允许负值
性能：使用 JCIF 将文件复制到 Windows 网络的速度非常慢

我正在尝试将文件从本地计算机复制到 Windows 服务器中的共享文件夹这是我使用的功能 public static void copyFileUsingJcifs final String domain final String use
如何将新工具箱添加到已安装的 Matlab 版本中？

我需要向我的 Matlab Student 版本添加一个工具箱我知道我必须下载工具箱文件将它们放在某个目录中然后指定路径但是我不太确定必须将文件放在哪里我下载了两个 zip 存档 Symbolic Math Toolbox Co
如何在 MMT 中粘合/识别两个结构中的内含物？

我想形式化形式语言及其语义MMT https uniformal github io 并定义一个一般概念语义等价两种语义 one句法准确地说对后者进行编码实际上是一种识别粘合我不知道如何在 MMT 中做到这一点接下来让我详细说明我
IE6 将 DOCTYPE 更改为错误的 DOCTYPE

我正在使用定义了以下内容的网站DOCTYPE 当我访问该网站时IE6 DOCTYPE神奇地变成了而且好吧它可以保留因为一切看起来都很好但这是重点只有一页有DOCTYPE变成
如何编写使用OpenERP ORM直接上传到Postgres数据库的Python脚本

我需要在 Python 中编写一个独立脚本仅使用 OpenERP 的 ORM 模块将销售税上传到数据库中的 account tax 表我想做的是类似下面的伪代码有人可以向我提供有关以下内容的更多详细信息 1 我需要设置什么sys
ImageView 内的 Android ProgressBar

我有一个活动通过异步任务用数据填充列表视图另外我正在后台加载图片在加载图片时我想在图像视图中显示进度条而不是默认图标我在互联网上搜索了任何示例等但找不到任何有用的东西我只找到一个响应它说您必须使用图像视图和进度条进行框架布局
JQuery获取formaction和formmethod

我有一个像这样的
如何在 Git 中执行三向比较而不合并？

我想在具有公共合并基础的两个 git 分支之间执行三向差异并使用 kdiff3 查看它我发现了很多关于SO的指导以及一些非常相似的问题 1 https stackoverflow com q 26301307 3380131 2 ht
SQL Server Express (2012) 和 LocalDB 之间有区别吗？

以他的优秀和受欢迎对比图 http erikej blogspot com 2011 01 comparison of sql server compact 4 and html ErikEJ 区分了SQL Server Express 2
MySQL GROUP BY 仅返回第一行

我有一个名为forms具有以下结构 GROUP FORM FILEPATH SomeGroup SomeForm1 SomePath1 SomeGroup SomeForm2 SomePath2 我使用以下查询 SELECT FROM fo
如何将高度（阴影）添加到我的 BottomNavigationView。默认情况下它不会出现

I tried setting elevation from xml and programmatically both But nothing works 仅当您在 BottomNavigationView 中将白色设置为 android
在匿名 PHP 函数中访问父作用域的变量 [重复]

这个问题在这里已经有答案了我想编写一个函数来执行一些记录事务的脏工作但匿名函数作用域似乎没有注册父作用域 db and value变量如何将变量传递到闭包中讽刺的是 SO 标签 closures 并没有非常准确地描述它的 PHP 版
将 NSString 的 NSArray 转换为 NSMutableString 的 NSArray

如何做到这一点而不必使用 for 循环滚动整个给定数组我能想到的最好的办法是 NSMutableArray replacementArray NSMutableArray array originalArray enumerateO
从（行、列、值）数据创建 Pandas DataFrame

我有一个包含三列的 Pandas Dataframe 行列值行值都是低于某些的整数N 并且列值都是低于某个值的整数M 这些值都是正整数如何有效地创建数据框N行和M列带有 at 索引i j价值val if i j val 是我原始数

从（行、列、值）数据创建 Pandas DataFrame

从（行、列、值）数据创建 Pandas DataFrame 的相关文章

随机推荐

热门标签