根据键重塑数组

2024-01-07

我不知道我想要做什么的确切技术术语，所以我将尝试用一个例子来演示：

我有两个长度相同的向量，a and b，如下：

In [41]:a
Out[41]:
array([ 0.61689215,  0.31368813,  0.47680184, ...,  0.84857976,
    0.97026244,  0.89725481])

In [42]:b
Out[42]:
array([35, 36, 37, ..., 36, 37, 38])

a包含 N 个浮点数并且b包含 N 个元素：具有 10 个不同值的键：35、36、37、...、43、44

我希望得到一个新的矩阵M有 10 列，其中第一列包含中的所有行a其对应的键为b是 35。第二列M包含中的所有行a其对应的键为b是 36。等等，直到第 10 列M.

我希望这一点很清楚。谢谢

itertools.groupby可用于对值进行分组（排序后）。用于numpy arrays是可选的。

import numpy as np
import itertools
N=50
# a = np.random.rand(50)*100
a = np.random.randint(0,100,N) # int to make printing more compact
b = np.random.randint(35,45, N)

# make structured array to easily sort both arrays together
dtype = np.dtype([('a',float),('b',int)])
ab = np.ndarray(a.shape,dtype=dtype)
ab['a'] = a
ab['b'] = b
# ab = np.sort(ab,order=['b']) # sorts both 'b' and 'a'
I = np.argsort(b,kind='mergesort') # preserves order
ab = ab[I]

# now group, and extract lists of lists
gp = itertools.groupby(ab, lambda x: x['b'])
xx = [list(x[1]) for x in gp]
#print np.array([[y[0] for y in x] for x in xx]) # list of lists

def filled(x):
    M = max(len(z) for z in x)
    return np.array([z+[np.NaN]*(M-len(z)) for z in x])
print filled([[y[1] for y in x] for x in xx]).T
print filled([[y[0] for y in x] for x in xx]).T

生产：

[[ 35.  36.  37.  38.  39.  40.  41.  42.  43.  44.]
 [ 35.  36.  37.  38.  39.  40.  41.  42.  43.  44.]
 [ nan  36.  37.  nan  39.  40.  41.  42.  43.  44.]
 [ nan  36.  37.  nan  39.  40.  41.  42.  43.  44.]
 ...]

[[ 54.  69.  34.  28.  71.  53.  33.  19.  64.  56.]
 [ 90.  52.  11.   9.  50.  53.  25.  37.  69.  56.]
 [ nan  97.  31.  nan  69.  35.   2.  80.  91.  54.]
 [ nan  33.  87.  nan  47.  90.  81.  45.  86.  57.]
 ...]

我在用argsort with mergesort保持秩序a在子列表内。np.sort对两者进行词法排序b and a（与我的预期相反order范围）。

另一种方法是使用 Python 字典，也保留了顺序a。在大型数组上它可能会更慢，但它隐藏的细节更少：

import collections
d = collections.defaultdict(list)
for k,v in zip(b,a):
    d[k].append(v)
values = [d[k] for k in sorted(d.keys())]
print filled(values).T

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Arrays

NumPy

reshape

根据键重塑数组的相关文章

是否可以在 IPython 控制台中显示 pandas 样式？

是否可以显示熊猫风格 https pandas pydata org pandas docs stable user guide style html在 iPython 控制台中 Jupyter 笔记本中的以下代码 import panda
在Python中将大文件（25k条目）加载到dict中很慢？

我有一个大约有 25000 行的文件它是 s19 格式的文件每行就像 S214780010 00802000000010000000000A508CC78C 像这样的事情怎么样我做了一个测试文件只有一行S21478001000802
如何在plotly（python）中的刻度标签和图形之间添加空格？

如果我使用绘图创建水平条形图则每个条形的标签都与图表相对应我想在标签和图表之间添加一些空间填充边距我怎样才能做到这一点 Example import plotly offline as py import plotly graph
是否可以在 PowerShell 中使 IndexOf 不区分大小写？

我在终端服务器中由查询会话命令组成的数组中搜索索引时遇到问题这是有问题的脚本 Array of logged users in terminal servers a Get RDUsersession CollectionName BLA
为什么我会收到 ValueError：系列的真值不明确。使用 a.empty、a.bool()、a.item()、a.any() 或 a.all()

以下代码给出了值错误 major males for row in recent grads if recent grads Men gt recent grads Women major males append recent grads
无法使用Python请求会话模块登录网站

我刚刚开始进行网络抓取对于我的第一个项目我尝试使用 requests Session 登录 artofproblemsolving com 并访问另一个用户的帐户这是我的代码 import requests LOGIN URL htt
toArray 与预先确定大小的数组

使用时ar toArray new String ar size 安卓工作室3 2 1警告预先确定大小的数组并建议空数组有两种方式将集合转换为数组使用预先确定大小的数组如 c toArray new String c size 或使
Python FTP下载550错误

我编写了一个 ftp 爬虫来下载特定文件它会一直工作直到找到要下载的特定文件然后抛出此错误 ftplib error perm 550 该文件存在于我的下载文件夹中但文件大小为 0 kb 我需要转换某些内容才能下载吗我可以访问 f
matplotlib vlines 图中未应用 y 轴的最小值

我正在 matplotlib 中绘制 vlines 图数据集中的所有 y 值如下 gt 0 我希望 y 轴最底部的刻度能够读取0 但相反我得到 500 这是代码 usr bin env python import numpy as np
Pygame：有人可以帮我实现双跳吗？

我知道已经有其他关于此问题的帖子了但我的运动系统与我发现的有点不同所以随后我问这个问题我的运动系统基于一个名为的命名元组Move up left right down 然后就是这个 def update self move block
在python中使用编解码器utf-8打开文件错误

我在 windows xp 和 python 2 6 4 上执行以下代码但它显示 IOError 如何打开名称带有 utf 8 编解码器的文件 gt gt gt open unicode txt euc kr encode utf 8 T
在Python中随机交错2个数组

假设我有两个数组 a 1 2 3 4 b 5 6 7 8 9 我想将这两个数组交错为变量 c 注意 a 和 b 不一定具有相同的长度但我不希望它们以确定性的方式交错简而言之仅仅压缩这两个数组是不够的我不想要 c 1 5 2 6 3
在 4K 屏幕上使用 Matplotlib 和 TKAgg 或 Qt5Agg 后端

我在 Ubuntu 16 04 上使用 Matplotlib 2 0 和 Python 3 6 来创建数据图电脑显示器的分辨率为 4k 分辨率为 3840x2160 绘图数字看起来非常小字体也很小我已经尝试过TKAgg and Qt5
是否有 R 函数可以将这些数据从长形重塑为宽形？

数据现在看起来如何 Coach ID Student score 1 A 8 1 B 3 2 A 5 2 B 4 2 C 7 看起来像这样 Coach ID Student score student 2 score 2 student 3
python 中的 F 字符串前缀给出语法错误[重复]

这个问题在这里已经有答案了我有一个名为 method 的变量它的值是 POST 但是当我尝试运行时print f method method is used 它不断在最后一个双引号处给出语法错误我找不到它这样做的原因我正在使用 py
将二进制数据视为文件对象？

在此代码片段由另一个人编写中 self archive是一个大文件的路径并且raw file是以二进制数据形式读取的文件内容 with open self archive rb as f f seek offset raw file s
带 Qt 的菜单栏/系统托盘应用程序

我是 Qt PyQt 的新手我正在尝试制作一个应用程序其功能将从菜单栏系统托盘执行这里展示了一个完美的例子我找不到关于如何做到这一点的好资源有人可以建议吗 Thanks 我认为您正在寻找与QMenu and QMainWindo
为数据集生成随机 JSON 结构排列

我想生成 JSON 结构的许多不同排列作为同一数据集的表示最好不需要对实现进行硬编码例如给定以下 JSON name smith occupation agent enemy humanity nemesis neo 应该产生许多不同
关闭正在运行代码的 IPython Notebook

怎么运行的我在 IPython Notebook 中运行了一些代码一些迭代工作我不小心关闭了正在运行的笔记本的浏览器但回到 IPython 仪表板我发现这个特定的笔记本尚未关闭所以如果我再次打开笔记本我会在它正在执行的代码前面
美丽的汤刮 - 登录凭据不起作用

尝试使用登录凭据抓取页面 payload email gmail com password urls login url https www spotrac com signin url https www spotrac com nba

随机推荐

iptables 转发和输入

我有一个装有 Linux 电脑的家庭网络所有电脑都运行着 iptables 我认为将我的 LAN 放在 Linux 网关防火墙后面更容易所以我在我的路由器和 LAN 之间放置了一台电脑带有 fedora 没有 gui 并配置了 ip
Amazon S3 预签名 URL

如果我将我的应用程序设置为生成用于访问 S3 媒体的预签名 URL 以便我可以将文件设置为私有除非通过登录用户访问那么如果有人有权访问那么我这样说是否正确到 URL 在到期时间内他们可以看到该文件尽管它是私有的因此如果有人
重载运算符和链接

我有一个类其中包含存储动态二维数组的对象矩阵我正在尝试重载运算符以便将 1 个矩阵复制到另一个矩阵上以下作品 Square Matrix a b c a b 但是这不起作用 a b c 它给了我以下错误1 与operator
QUANTEDA - 无效类“dfmSparse”对象

我收到此警告消息我使用这些数据 https github com kbenoit quanteda tree master data data char inaugural RData https github com kbenoit q
OpenCV 和 CMake 的链接问题

我正在编写一个使用OpenCV的程序安装在本地目录中因为我在那台机器上没有root权限并且我已经编写了相应的CMakeLists txt文件我的问题是编译在链接阶段以不同的方式失败我花了三个小时尝试了网上提出的所有不同的解决方案
如何获取随机 json 数据并附加到 div 元素

说这是我的 json imageSmall images employee jpgs employees abhishek 80x80 jpg imageBig images employee jpgs employees abhishek
玩 securesocial - 开发者环境和单元测试

我们在 Play 2 应用程序中使用 securesocial 模块进行身份验证我有两个关于这个模块的问题首先有没有一种简单的方法可以禁用开发环境中的授权检查最好不注释所有内容 SecureSocial SecuredAction注
使用 Python 下载共享的 Google Drive 文件夹

我的谷歌驱动器上有一个文件夹其中只有 jpg 图像我想使用该文件夹的共享链接将该文件夹中的所有图像下载到我的计算机上到目前为止我发现唯一有效的是下面的代码但我只能让它适用于特定的共享文件而不是整个文件夹 from google
使用 TabItem 时如何将 TabLayout 与 ViewPager 同步

我想用TabLayout with TabItem与以下代码
NuGet 包文件在构建期间未复制到项目内容

我正在使用 VS2012 professional 和 NuGet Package Manager 版本 2 2 31210 构建 MVC4 Web 应用程序我的解决方案中有多个项目所有项目都共享我使用 NuGet 安装的各种包我的项
基于组件的MVC框架和基于动作的MVC框架

您好我曾使用过 JSF 它是一个基于组件的 MVC 框架我知道很多 Web 项目都使用 Spring 作为其技术而 Spring 属于基于操作的 UI 框架类别我想知道这里有什么区别哪一种更先进并为用户提供更多灵活性一些优点
C 线程之间的消息传递

我试图让线程 A 与线程 B 进行通信我应该使用线程之间的消息传递来执行此操作但我试图找到一些解释消息传递的示例源代码有谁有一些解释消息传递的示例源代码 C 语言的良好链接吗虽然没有链接但有很多方法可以实现这一点首先是使用套接
C++中接口的多重继承

我有一个对象接口和派生对象可能想要支持的开放式接口集合 An object class IObject getAttribute 0 A mutable object class IMutable setAttribute 0 A lock
树的深度（哈斯克尔）

我试图弄清楚如何计算 Haskell 中一般树的深度我可以找出简单二叉树的解决方案但不能找出具有任意数量叶子的一般树这是我的二叉树代码 depth of a binary tree depth Tree a gt Int depth
Bootstrap 4 导航栏切换图标不出现

Visit https jsfiddle net 8tpm4z00 https jsfiddle net 8tpm4z00 div class container div
如何使用 React Native Stack Navigation 处理锁定方向

我有一个在 iOS 和 Android 上运行的 React Native Expo 应用程序使用具有两个视图的堆栈导航第一个视图锁定为纵向屏幕方向 export class HomeScreen extends Component c
如何让 setup.py 测试使用特定的 Fortran 编译器？

我正在尝试测试package https github com jsalvatier scikits bvp solver其中包括一些 f90 文件如果我构建或安装并指定 fortran 编译器它就可以正常工作但是当我尝试测试时出
如何在 Inno Setup 中的安装和卸载时使用带有依赖项的 DLL？

我想在卸载应用程序时在 iss 中导入两个 dll 我找不到办法做到这一点 procedure Installed external Installed files StatisticInstallInfo dll adcore dll c
使用 sed 或 grep 计算一行中的正则表达式模式匹配数？

我想计算单行上的匹配数或所有行因为总是只有一行我想不仅仅计算每行一场比赛如 echo 123 123 123 grep c E 123 Result 1 更好的例子 echo 1 1 2 2 2 5 grep c E 1 1 Res
根据键重塑数组

我不知道我想要做什么的确切技术术语所以我将尝试用一个例子来演示我有两个长度相同的向量 a and b 如下 In 41 a Out 41 array 0 61689215 0 31368813 0 47680184 0 84857976

根据键重塑数组

根据键重塑数组 的相关文章

随机推荐

热门标签

根据键重塑数组的相关文章