对按 numpy 中的变量分组的行取平均值

2024-05-11

我有一个如下所示的 numpy 数组。

array([[ 0.23810484,  0.00020161,  0.41350806,  0.2421371 ,  0.02237903,
         0.08084677,  0.00020161,  0.00221774,  0.00020161,  0.00020161],
       [ 0.04279661,  0.05974576,  0.02584746,  0.00042373,  0.00042373,
         0.00042373,  0.00042373,  0.73771186,  0.00889831,  0.12330508]])

是5000X10。

我还有一个 Pandas Series 对象，长度也是 5000。它的值是这样的>

5061             Terminated
17410    Completed Negative

共有三个不同的类别。每个系列值都是第一个 numpy 数组中相应行的类别。

我想要得到的是按系列中的类别分组的第一个数组中每个变量的平均值。所以最后我会得到一个 numpy 数组，每个系列类别有 3 行，十列的值将是所有 5000 行的平均值。

请指教

您可以将 numpy 数组中的每一列添加到 pandas DataFrame 中的单独列中，然后使用DataFrame.groupby()根据您所需的列进行分组，然后采取mean()。示例（假设您的系列称为 series ，并且 numpy 数组称为narray) -

df = pd.DataFrame(series)
for i in range(10):
    df[i] = narray[:,i]

df.groupby('required_column').mean()

Demo -

In [77]: df = pd.DataFrame([[5061,'Terminated'],[17410,'Completed Negative']],columns=['index','groupcol']).set_index('index')

In [78]: df
Out[78]:
                 groupcol
index
5061           Terminated
17410  Completed Negative

In [79]: x
Out[79]:
array([[  2.38104840e-01,   2.01610000e-04,   4.13508060e-01,
          2.42137100e-01,   2.23790300e-02,   8.08467700e-02,
          2.01610000e-04,   2.21774000e-03,   2.01610000e-04,
          2.01610000e-04],
       [  4.27966100e-02,   5.97457600e-02,   2.58474600e-02,
          4.23730000e-04,   4.23730000e-04,   4.23730000e-04,
          4.23730000e-04,   7.37711860e-01,   8.89831000e-03,
          1.23305080e-01]])

In [80]: for i in range(10):
   ....:     df[i] = x[:,i]
   ....:

In [81]: df
Out[81]:
                 groupcol         0         1         2         3         4  \
index
5061           Terminated  0.238105  0.000202  0.413508  0.242137  0.022379
17410  Completed Negative  0.042797  0.059746  0.025847  0.000424  0.000424

              5         6         7         8         9
index
5061   0.080847  0.000202  0.002218  0.000202  0.000202
17410  0.000424  0.000424  0.737712  0.008898  0.123305

In [82]: df.groupby('groupcol').mean()
Out[82]:
                           0         1         2         3         4  \
groupcol
Completed Negative  0.042797  0.059746  0.025847  0.000424  0.000424
Terminated          0.238105  0.000202  0.413508  0.242137  0.022379

                           5         6         7         8         9
groupcol
Completed Negative  0.000424  0.000424  0.737712  0.008898  0.123305
Terminated          0.080847  0.000202  0.002218  0.000202  0.000202

如果你想要结果作为列表，你可以这样做 -

df.groupby('required_column').mean().values.tolist()

Demo -

In [83]: df.groupby('groupcol').mean().values.tolist()
Out[83]:
[[0.04279661,
  0.05974576,
  0.02584746,
  0.00042373,
  0.00042373,
  0.00042373,
  0.00042373,
  0.73771186,
  0.00889831,
  0.12330508],
 [0.23810484,
  0.00020161,
  0.41350806,
  0.2421371,
  0.02237903,
  0.08084677,
  0.00020161,
  0.00221774,
  0.00020161,
  0.00020161]]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

pandas

对按 numpy 中的变量分组的行取平均值的相关文章

如何使用 lxml 解析包含前缀但没有名称空间声明的 XML？

我有一堆使用前缀但没有相应名称空间声明的 XML 文件像这样的东西
Python 按照层次结构按多个分隔符分割字符串

我只想根据多个分隔符例如 and 和按顺序分割字符串一次例子 121 34 adsfd gt 121 34 adsfd dsfsd and adfd gt dsfsd adfd dsfsd adfd gt dsfsd adfd dsf
turtle.Screen().screensize() 未输出正确的屏幕尺寸[重复]

这个问题在这里已经有答案了我编写了一些代码来在屏幕周围随机放置点但是它并没有覆盖整个屏幕 import turtle import random t turtle Turtle color red green blue pink ye
OpenCV - 我需要将彩色图像插入黑白图像并且

我用以下代码将黑白图像插入彩色图像没问题 face grey cv cvtColor face cv COLOR RGB2GRAY for row in range 0 face grey shape 0 for column in ra
Seaborn 热图中的自定义调色板间隔

我正在尝试绘制一个heatmap https seaborn pydata org generated seaborn heatmap html使用seaborn库绘图函数如下所示 def plot confusion matrix da
检测/删除 Python 2 + GTK 中不成对的代理字符

在Python 2 7中我可以成功转换Unicode字符串 abc udc34xyz 转换为 UTF 8 结果是 abc xed xb0 xb4xyz 但是当我将 UTF 8 字符串传递给例如时 pango parse markup or
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
如何为 Python 中的应用程序设置专用屏幕区域？

MS OneNote 就是一个很好的例子它可以选择固定在屏幕的一侧并将所有其他窗口推到一侧当最大化或调整其他窗口大小时它们只能扩展到 OneNote 的边缘 Python 使用 Tkinter 或其他模块是否具有此功能感谢您的帮助
Python，多线程，获取网页，下载网页

我想在一个站点批量下载网页我的 urls txt 文件中有 5000000 个 url 链接大约有300M 如何让多线程链接这些网址并下载这些网页或者如何批量下载这些网页我的想法 with open urls txt r as f
PyCharm - 如何挂起所有线程

我们使用 PyCharm 5 0 1 进行多线程调试当它在断点处停止时只有特定线程停止而所有其他线程继续这使得冻结时刻和检查参数值以及其他线程的当前状态变得困难当其中一个线程在断点处停止时是否可以挂起所有线程这在最新的 P
如何测试列表中多个值的成员资格

我想测试两个或多个值是否在列表中具有成员资格但我得到了意外的结果 gt gt gt a b in b a foo bar a True 那么 Python 可以同时测试列表中多个值的成员资格吗这个结果意味着什么 See also How
Celery：每个工作人员的 task_acks_late 的不同设置/向 celery 添加自定义选项

这个问题是后续问题django celery 禁用一个工作者的预取有错误吗 https stackoverflow com questions 58290045 django celery disable prefetch for one
如何修改 contenteditable 元素的innerHTML

我使用 Selenium 与 Chrome driver 和 python3 6 来测试网站我在网页中有代码片段如下 div class 3F6QL 2WovP div class 39LWd Type a message div div
当价格低于阈值时使用 pandas DataFrame 实施矢量化止损

给出这个示例数据框 date close signal positions 2017 01 02 27 90 0 0 0 0 2017 01 03 27 76 0 0 0 0 2017 01 04 28 65 1 0 1 0 2017 01
如何可视化多维数据上的 kmeans 聚类

我在 mnist 数据集上使用 kmeans 聚类算法并希望可视化聚类后的图到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
如何限制scrapy请求对象？

所以我有一个蜘蛛我认为它正在泄漏内存结果当我检查 telnet 控制台 gt gt gt prefs 时它只是从链接丰富的页面中抓取了太多链接有时它会超过 100 000 个现在我已经一遍又一遍地浏览文档和谷歌但我找不到一种方法
如何将 fields 参数传递到 Google Drive Python API 调用中

I have results drive service files list body execute where body q query string maxResults 1 为了提高性能我想限制返回的字段如下所述 https
如何保持 python 3 脚本 (Bot) 运行

不是母语英语抱歉英语可能很蹩脚我也是编程新手您好我正在尝试使用 QueryServer 连接到 TeamSpeak 服务器来创建机器人经过几天的努力它有效只有 1 个问题而我却被这个问题困扰了如果您需要检查这是我正在使
Flask 扩展未在 app.extensions 中注册

我想访问在我的 Flask 应用程序上注册的一些扩展我尝试使用app extensions 但我初始化的一些扩展不在字典中 from flask import current app current app extensions get
如何配置 Eclipse 在使用 Pydev 插件选择“运行”或“调试”时启动浏览器

我正在使用 Eclipse Pydev 插件学习 Python 和 Django 当我按运行或调试时我希望内部或外部浏览器使用 URL http 127 0 0 1 启动或刷新我见过用 PHP 插件完成的但没有用 Pydev

随机推荐

Delphi 2007 中的 HelpInsight 文档

我正在使用 D2007 并尝试使用 HelpInsight 功能自 D2005 起提供来记录我的源代码我主要对让 HelpInsight 工具提示正常工作感兴趣通过各种网上冲浪和实验我发现了以下内容使用三斜杠注释样式比其他记录
使用 Spring Security 将数据库和 SAML 身份验证合并到一个应用程序中

我正在尝试使用 spring security spring security starter 在 spring boot 2 2 4 应用程序中实现身份验证和授权使用案例根据用户名我想将用户重定向到特定的身份验证提供商如果用户名结
当我只能处理文件或文件路径时如何处理 SAF？

背景在 Android Q 之前如果我们想获取有关 APK 文件的信息我们可以使用写外部存储 https developer android com reference android Manifest permission html
我可以使用 WatiN 读取 JavaScript 警报框吗？

我想使用 WatiN 来验证 JavaScript 警报框中的错误消息这可能吗谢谢 see 特雷夫的博客 http tmichealson blogspot com 2007 01 handling alerts in watin ht
如何在sqlalchemy中编写自己的方言来适应HTTP API？

我正在尝试向 Superset 数据探索平台添加一个特殊的数据源该数据库仅支持HTTP API 返回json格式的数据例如 gt http localhost api sql query q select from table lt
配置jedi不自动完成？

我在 emacs 中安装了 jedi mode 来进行 python 编辑因为我发现C and C 对于跳转到定义并返回非常有用然而自动完成并不是我想要的当我尝试在安装了 jedi 的情况下使用 emacs 时它会不断尝试提供建议
使到 n 个点的集合的欧氏距离之和最小的点

我有一组点W x1 y1 x2 y2 xn yn 在 2D 平面上你能找到一种算法将这些点作为输入并返回一个点 x y 在 2D 平面上距以下点的距离之和最小W 换句话说如果 di Euclidean distance x y xi
在android中使用VoiceInteractionService的HotwordDetector

我正在使用自定义命令创建语音识别服务例如 Ok Google 为此我使用了VoiceInteractionService我引用了代码here http androidxref com 5 0 0 r2 xref frameworks ba
Vue 3 - 如何使用反应式引用并在没有 .value 的情况下进行计算？

当我们使用选项 API https v3 vuejs org api options api html 我们可以在中定义一些属性computed部分和一些属性data部分所有这些都可以通过实例从实例访问this引用即在同一个对象中非常
如何将现有回调 API 转换为 Promise？

我想使用 Promise 但我有一个回调 API 其格式如下 1 DOM加载或其他一次性事件 window onload set to callback window onload function 2 普通回调 function requ
VM428:7 未捕获类型错误：无法在 :7:17 处读取 null 属性（读取“CodeMirror”）

代码运行良好但我不明白在哪里收到此错误 VM428 7 Uncaught TypeError Cannot read properties of null reading CodeMirror at
提取所有列组中共有的元素

我有一个 R 数据集 x 如下 ID Month 1 1 Jan 2 3 Jan 3 4 Jan 4 6 Jan 5 6 Jan 6 9 Jan 7 2 Feb 8 4 Feb 9 6 Feb 10 8 Feb 11 9 Feb 12 10
2013 年 HTML 电子邮件：如何控制段落和图像等元素之间的间距？

我目前正在重新设计一些 HTML 电子邮件模板这是我几年来没有做过如此深入的事情我已经在 HTML 文件中制作了模板我正在浏览器中本地测试该模板一切看起来都很好我使用表格进行布局我使用的唯一其他标签是 p a and img C
结构体tag和name，为什么声明为name的局部变量会编译？

在我最近看到的一些代码中有一个如下定义的结构 typedef struct tagMyStruct int numberOne int numberTwo MYSTRUCT 按照我的理解 tagMyStruct是新的数据类型并且MYSTR
12/24小时模式冲突

我是一名法国 Android 开发者所以使用Locale getDefault 导致我的DateFormat使用 24 小时模式但是当我通过设置菜单将设备手动设置为 12 小时模式时 DateFormat以 24 小时格式持续进行相
为什么每次用户启动应用程序时都要注册推送通知？

在Apple文档中你可以找到下面这句话应用程序应在每次启动时进行注册并向其提供者提供当前令牌它调用 registerForRemoteNotificationTypes 来启动注册过程因此当我在应用程序中实现推送通知时我必须注册
使用 AVFoundation 和 Swift 访问多个音频硬件输出/通道

如何使用 AVFoundation 访问除 1 2 之外的其他音频硬件输出我正在为 Mac OS X 应用程序编写快速代码该应用程序通过各种输出设备 USB 接口 dante soundflower 播放 mp3 文件如下所示 myP
谷歌驱动器使用统计谷歌驱动器UI和API之间的差异

我们正在使用 Google Drive API关于获取 https developers google com drive v2 reference about get方法返回一个关于资源 https developers google
如何使用Python高效地将CSV文件数据插入MYSQL？

我有一个带有 aprox 的 CSV 输入文件 400 万条记录插入已运行超过 2 小时但仍未完成数据库仍然是空的关于如何实际插入值的任何建议使用insert into 并且更快比如将插入物分成块我对 python 还很陌生
对按 numpy 中的变量分组的行取平均值

我有一个如下所示的 numpy 数组 array 0 23810484 0 00020161 0 41350806 0 2421371 0 02237903 0 08084677 0 00020161 0 00221774 0 000201

对按 numpy 中的变量分组的行取平均值

对按 numpy 中的变量分组的行取平均值 的相关文章

随机推荐

热门标签

对按 numpy 中的变量分组的行取平均值的相关文章