Python：用于元组的 Pandas DataFrame

2024-01-10

这是为元组创建 DataFrame 的正确方法吗？（假设元组是在代码片段内创建的）

import pandas as pd
import numpy as np
import random

row = ['a','b','c']
col = ['A','B','C','D']

# use numpy for creating a ZEROS matrix
st = np.zeros((len(row),len(col))) 
df2 = pd.DataFrame(st, index=row, columns=col)

# CONVERT each cell to an OBJECT for inserting tuples
for c in col:
    df2[c] = df2[c].astype(object)

print df2

for i in row:
    for j in col:
        df2.set_value(i, j, (i+j, np.round(random.uniform(0, 1), 4)))

print df2

正如你所看到的，我首先创建了一个zeros(3,4)在 numpy 中，然后将每个单元格设置为 Pandas 中的对象类型，以便我可以插入元组。这是正确的方法还是有更好的解决方案将元组添加/检索到矩阵？

结果很好：

   A  B  C  D
a  0  0  0  0
b  0  0  0  0
c  0  0  0  0


          A             B             C             D
 a  (aA, 0.7134)   (aB, 0.006)  (aC, 0.1948)  (aD, 0.2158)
 b  (bA, 0.2937)  (bB, 0.8083)  (bC, 0.3597)   (bD, 0.324)
 c  (cA, 0.9534)  (cB, 0.9666)  (cC, 0.7489)  (cD, 0.8599)

首先，回答您的字面问题：您可以从列表列表构造 DataFrame。列表列表中的值本身可以是元组：

import numpy as np
import pandas as pd
np.random.seed(2016)

row = ['a','b','c']
col = ['A','B','C','D']

data = [[(i+j, round(np.random.uniform(0, 1), 4)) for j in col] for i in row]
df = pd.DataFrame(data, index=row, columns=col)
print(df)

yields

              A             B             C             D
a  (aA, 0.8967)  (aB, 0.7302)  (aC, 0.7833)  (aD, 0.7417)
b  (bA, 0.4621)  (bB, 0.6426)  (bC, 0.2249)  (bD, 0.7085)
c  (cA, 0.7471)  (cB, 0.6251)    (cC, 0.58)  (cD, 0.2426)

话虽如此，请注意，在 DataFrame 中存储元组注定会导致 Python 速度的循环。要利用快速 Pandas/NumPy 例程，您需要使用本机 NumPy 数据类型，例如np.float64（相反，元组需要“对象”数据类型）。

因此，对于您的目的来说，更好的解决方案可能是使用两个单独的 DataFrame，一个用于字符串，一个用于数字：

import numpy as np
import pandas as pd
np.random.seed(2016)

row=['a','b','c']
col=['A','B','C','D']

prevstate = pd.DataFrame([[i+j for j in col] for i in row], index=row, columns=col)
prob = pd.DataFrame(np.random.uniform(0, 1, size=(len(row), len(col))).round(4), 
                    index=row, columns=col)
print(prevstate)
#     A   B   C   D
# a  aA  aB  aC  aD
# b  bA  bB  bC  bD
# c  cA  cB  cC  cD

print(prob)
#         A       B       C       D
# a  0.8967  0.7302  0.7833  0.7417
# b  0.4621  0.6426  0.2249  0.7085
# c  0.7471  0.6251  0.5800  0.2426

要循环遍历列，找到概率最大的行并检索相应的行prevstate，你可以使用.idxmax and .loc:

for col in prob.columns:
    idx = (prob[col].idxmax())
    print('{}: {}'.format(prevstate.loc[idx, col], prob.loc[idx, col]))

yields

aA: 0.8967
aB: 0.7302
aC: 0.7833
aD: 0.7417

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python：用于元组的 Pandas DataFrame 的相关文章

蜘蛛内的Scrapyd jobid值

Scrapy 框架 Scrapyd 服务器我在获取蜘蛛内部的 jobid 值时遇到一些问题将数据发布到后http localhost 6800 schedule json http localhost 6800 schedule jso
我应该为 MySQL 使用什么 python 3 库？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案据我所知 MySQLdb 仍然没有移植到 Python 3 pypy 上似乎有另一个名为 PyMySQL
小数缓存是Python规范中定义的还是一个实现细节？

Python 似乎有一个所谓的小数字缓存用于存储 5 到 256 范围内的数字我们可以使用以下程序来演示这一点 for i in range 7 258 if id i id i 0 print i is cached else pr
如何从 Lua 调用 Python 函数？

我想从我的 lua 文件运行 python 脚本我怎样才能实现这个目标 Example Python代码 sum py file def sum from python a b return a b Lua code main lua f
Django 未在 404 页面上应用应用程序中的 CSS 文件

姜戈3 0 8 Python 3 7 x 我有一个包含一些应用程序的 Django 项目我正在尝试为 400 403 404 500 错误制作一些默认错误页面我已经这样做了并显示了适当的模板但没有任何样式或 JS 在 404 错
turtle.Screen().screensize() 未输出正确的屏幕尺寸[重复]

这个问题在这里已经有答案了我编写了一些代码来在屏幕周围随机放置点但是它并没有覆盖整个屏幕 import turtle import random t turtle Turtle color red green blue pink ye
python 脚本中 os.system 的 256 和 512 响应代码是什么

当我在 python 中使用 os system ping 服务器时我得到多个响应代码使用的命令 os system ping q c 30 s SERVERANME 0 在线 256 离线 512 512 是什么意思 Per the
如何使用 xlrd 将新列和行添加到 .xls 文件

如何向 xlrd 中的工作表添加新列和或行我有一个使用 open workbook 读取的 xls 文件我需要在第一张表中添加一个新列 bouncebacks 然后在该表中添加新行但我在 xlrd 文档中找不到任何显示如何添加新行和
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
读取文件特定行号的有效方法。（奖励：Python 手册印刷错误）

我有一个 100 GB 的文本文件它是来自数据库的 BCP 转储当我尝试导入它时BULK INSERT 我在第 219506324 行上收到一个神秘错误在解决此问题之前我想看看这一行但可惜的是我最喜欢的方法 import line
pandas to_sql sqlalchemy 与 secure_transport 的连接

我正在尝试将数据发送到具有 require secure transport ON 的服务器上的 mysql 数据库当我尝试使用以下代码连接到它时 import pandas as pd import pymysql from sqlal
如何删除 pandas 数据框中的唯一行？

我遇到了一个看似简单的问题在 pandas 数据框中删除唯一的行基本上相反drop duplicates https pandas pydata org pandas docs stable generated pandas Data
如何在交互式绘图（Python）中获得鼠标指向的（x，y）位置？

我使用 ipython 笔记本带有魔法 matplotlib nbagg 我正在审查matplotlib widget Cursor但仅查看光标widgets Cursor http matplotlib org 1 4 3 exampl
如何在 Sublime 2 REPL Mac 中运行 Python 3

我的问题如下我安装了 sublime 2 和 sublime repl 插件一切正常我唯一需要的是更改在控制台内置的 sublimerepl 上运行的 python 版本我的意思是我有 python 2 7 5 预先安装了 mav
Celery：每个工作人员的 task_acks_late 的不同设置/向 celery 添加自定义选项

这个问题是后续问题django celery 禁用一个工作者的预取有错误吗 https stackoverflow com questions 58290045 django celery disable prefetch for one
Scrapy的redirect_urls异常.KeyError

我是 Scrapy 和 Python 的新手最近推出了我的第一个蜘蛛有一个功能似乎以前有效但现在它只适用于我试图废弃的一些网站代码行是 item url direct response request meta redirect u
Scrapy 抓取并跟踪 href 中的链接

我对 scrapy 很陌生我需要从 url 的主页跟踪 href 到多个深度再次在 href 链接内我有多个 href 我需要遵循这些href 直到到达我想要抓取的页面我的页面的示例 html 是初始页 div class page
Flask 扩展未在 app.extensions 中注册

我想访问在我的 Flask 应用程序上注册的一些扩展我尝试使用app extensions 但我初始化的一些扩展不在字典中 from flask import current app current app extensions get
在至少 7 天内连续三天登录该产品的用户

我有一个用于用户参与的数据框 df 如下所示 time stamp user id 2013 01 01 10 05 23 1 2013 01 03 16 35 23 1 2013 01 06 11 06 35 1 2013 01 10 1
django admin 中内联模型的分页器

我有这个简单的 django 模型由一个传感器和特定传感器的值组成每个日射强度计的值数量很多 gt 30k 是否可以以某种方式分页PyranometerValues在特定日期或一般情况下将分页器应用于管理内联视图 class Pyran

随机推荐

如何让 PHP 会话在浏览器关闭或延长一段时间后过期

当用户关闭浏览器时我的 php 会话设置为过期但我注意到如果我让浏览器打开很长一段时间例如 24 小时以上会话仍然存在有没有办法让这些会话在浏览器关闭或经过一段较长时间后过期解决方案可能是通过设置数据ini set sess
应用程序引擎部署时使用 [13] 处理用户代码时出错

我下载了google官方最新的Node js应用程序引擎演示并部署到标准环境但出现了这个问题 ERROR gcloud app deploy Error Response 13 Error processing user code 这是演
Android - 使用 AccountManager 获取用户数据/手机所有者的名字和姓氏

我想预先填充我的应用程序中的一些字段以在用户订阅我的应用程序内的服务时为用户提供帮助那么我如何获得设备所有者的名字和姓氏我想使用与 Google 帐户绑定的默认信息到目前为止我得到了这个 AccountManager am Acco
FormRequest 验证失败返回 500 错误，而不是 422 错误（5.2 升级后）

从 L5 1 更新到 L5 2 后我不再收到 JSON 对象作为失败的 FormRequest 即 AJAX post 请求的响应通常我会收到 422 响应例如 email E mail is invalid firstname F
使用 printf 时如何转义 shell 脚本中的特殊字符？

我正在尝试格式化字符串printf在 shell 中我将从文件中获取输入字符串其中包含特殊字符例如 user tan etc 如何转义输入字符串中的特殊字符 Eg bin bash string function GET LINES
ngOnInit 和 Constructor 被调用两次

由于某种原因我的函数被调用两次但我似乎不明白为什么我在这里看到这个问题为什么 ngOnInit 调用了两次 https stackoverflow com questions 38787795 why ngoninit called
为什么我无法在 Playground 中使用 AVURLAsset 从媒体文件中提取数据？

在我的游乐场 import Cocoa import Foundation import AVFoundation var path2 Users me Movies bukesiyi mp4 var video2 NSURL fileUR
如何在Spring boot中聚合健康指标

我使用它为我的 Spring 2 0 4 应用程序添加了执行器支持拜尔东文章 https www baeldung com spring boot actuators 在第 4 4 节中它讨论了健康指标的一个方便功能是我们可以将它们聚合
Visual Studio 在编辑器中隐藏选项卡（选项卡井）

我确信这个功能曾经可用但我似乎找不到了您过去可以在没有选项卡的编辑器中打开文档换句话说您仅依靠键盘在打开的文档之间导航有人可以帮忙吗单击选项卡上的齿轮图标然后单击将选项卡放在顶部
文件/图像上传后 ASP.NET 3.0 mvc 应用程序崩溃

我正在使用 ASP Net Core 3 0 我想创建一个带有图像的新产品但在我从文件上传中选择图像并按下创建按钮后我的应用程序崩溃了我尝试在控制器上进行调试但应用程序在到达控制器之前崩溃了其他一切都在致力于创造行动当我注释
如何从 tds 添加多个字符串？

我正在尝试添加多个美元金额的字符串我从我的转换得到 NaNparseFloat 但我删除了美元符号和所有逗号有什么建议么我尝试过简单地添加它们而不使用parseFloat 但我只是得到一个连接字符串 function calculat
如何将 YUV420p 转换成 RGB 用于 ffmpeg 编码器？

我想使用 C 代码从位图图像制作 avi 视频文件我写了以下代码 Get RGB array data from bmp file uint8 t rgb24Data new uint8 t 3 imgWidth imgHeight hB
反向标签编码给出错误

我使用标签编码器将分类数据标记为数字数据 data Resi LabelEncoder fit transform data Resi 但是当我尝试找到它们如何在内部映射时 list LabelEncoder inverse transfo
未调用未捕获的异常处理程序

我正在尝试捕获 Mac 应用程序上的异常以便可以将它们记录在自定义日志文件中我正在像这样实现异常处理程序 void uncaughtExceptionHandler NSException exception NSLog It Work
如果 main() 不返回 int 值会发生什么？

我知道在 C 编译器中main 函数被调用 start 函数的代码如下 exit main return value of main is returned 如何 start 工作时main 不返回int 例如如果它的返回类型是void f
在 gdb 中显示参数包的值[重复]

这个问题在这里已经有答案了如何查看 gdb 中可变参数函数中参数包的值示例代码 VariadicDebug cpp template
R 插入符号 createFolds 与 createMultiFolds 差异

我创建折叠以进行交叉验证caret 我发现 createFolds 和 createMultiFolds 函数之间存在差异在我看来 createFolds 是没有替换的根据我的理解这是正确的版本 createMultiFolds 有两
什么时候使用 libmysql-6.1.dll 和 libmysql.dll？

我正在使用 HeidiSQL 编辑 MYSQL 数据库它询问我要使用哪个库进行编辑 libmysql 6 1 dll libmysql dll 我怎么知道该使用哪一个这些替代品libmysql dll and libmariadb dl
使用 Visual Studio 2010 打开 Visual Studio 2013 项目

我需要使用 Visual studio 2010 打开 Visual studio 2013 项目可以吗谢谢我尝试过但它会产生兼容性错误我的项目是MVC4解决方案非常感谢你的回答首先您必须下载并安装 Visual Studi
Python：用于元组的 Pandas DataFrame

这是为元组创建 DataFrame 的正确方法吗假设元组是在代码片段内创建的 import pandas as pd import numpy as np import random row a b c col A B C D use n

Python：用于元组的 Pandas DataFrame

Python：用于元组的 Pandas DataFrame 的相关文章

随机推荐

热门标签