为什么具有单个组的数据帧 groupby 不返回数据帧？

2024-04-20

我怀疑这是我的问题的更简单形式here https://stackoverflow.com/questions/18518077/why-does-pandas-groupby-cut-give-different-form-of-output-with-single-record-inp。 [更新：不幸的是并非如此。]

如果你这样做（在 Pandas 0.11 中）：

df = pd.DataFrame([[1,2],[1,3],[2,4]],columns='a b'.split())
print df
g = df.groupby('a').count()
print type(g)
print g

你会得到预期的结果：

   a  b
0  1  2
1  1  3
2  2  4
<class 'pandas.core.frame.DataFrame'>
   a  b
a      
1  2  2
2  1  1

但如果只有一个结果组，您会得到一个非常奇怪的系列：

df = pd.DataFrame([[1,2],[1,3],[1,4]],columns='a b'.split())
...

   a  b
0  1  2
1  1  3
2  1  4
<class 'pandas.core.series.Series'>
a   
1  a    3
   b    3
Name: 1, dtype: int64

但我宁愿结果是一个与此等效的 DataFrame：

print pd.DataFrame([[3,3]],index=pd.Index([1],name='a'),columns='a b'.split())

   a  b
a      
1  3  3

我对如何轻松地从该系列中获得这一点感到困惑（并且不确定为什么我首先会得到它）。

在 pandas 0.12 中，这正是您所要求的。

In [3]: df = pd.DataFrame([[1,2],[1,3],[1,4]],columns='a b'.split())

In [4]: df.groupby('a').count()
Out[4]:
   a  b
a
1  3  3

复制您所看到的内容squeeze=True:

In [5]: df.groupby('a', squeeze=True).count()
Out[5]:
a
1  a    3
   b    3
Name: 1, dtype: int64

如果无法升级，请执行以下操作：

In [3]: df.groupby('a').count().unstack()
Out[3]:
   a  b
a
1  3  3

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

为什么具有单个组的数据帧 groupby 不返回数据帧？的相关文章

如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

我正在尝试使用全向模块 http docs opencv org trunk db dd2 namespacecv 1 1omnidir html用于对鱼眼图像进行扭曲处理Python 我正在尝试适应这一点C 教程 http docs op
将html数据解析成python列表进行操作

我正在尝试读取 html 网站并提取其数据例如我想查看公司过去 5 年的 EPS 每股收益基本上我可以读入它并且可以使用 BeautifulSoup 或 html2text 创建一个巨大的文本块然后我想搜索该文件我一直在使用
Pandas 日期时间格式

是否可以用零后缀表示 pd to datetime 似乎零被删除了 print pd to datetime 2000 07 26 14 21 00 00000 format Y m d H M S f 结果是 2000 07 26 14
Python zmq SUB 套接字未接收 MQL5 Zmq PUB 套接字

我正在尝试在 MQL5 中设置一个 PUB 套接字并在 Python 中设置一个 SUB 套接字来接收消息我在 MQL5 中有这个 include
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
如何使用 Pandas、Numpy 加速 Python 中的嵌套 for 循环逻辑？

我想检查一下表的字段是否TestProject包含了Client端传入的参数嵌套for循环很丑陋有什么高效简单的方法来实现吗非常感谢您的任何建议 def test parameter a list parameter b list g
在Python中连接反斜杠

我是 python 新手所以如果这听起来很简单请原谅我我想加入一些变量来生成一条路径像这样 AAAABBBBCCCC 2 2014 04 2014 04 01 csv Id TypeOfMachine year month year
datetime.datetime.now() 返回旧值

我正在通过匹配日期查找 python 中的数据存储条目我想要的是每天选择今天的条目但由于某种原因当我将代码上传到 gae 服务器时它只能工作一天第二天它仍然返回相同的值例如当我上传代码并在 07 01 2014 执行它时它
为什么 PyYAML 花费这么多时间来解析 YAML 文件？

我正在解析一个大约 6500 行的 YAML 文件格式如下 foo1 bar1 blah name john age 123 metadata whatever1 whatever whatever2 whatever stuff thi
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
在Python中检索PostgreSQL数据库的新记录

在数据库表中第二列和第三列有数字将会不断添加新行每次每当数据库表中添加新行时 python 都需要不断检查它们当 sql 表中收到的新行数低于 105 时 python 应打印一条通知消息警告数量已降至 105 以下另一方面
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
仅第一个加载的 Django 站点有效

我最近向 stackoverflow 提交了一个问题标题为使用mod wsgi在apache上多次请求后Django无限加载 https stackoverflow com questions 71705909 django infini
如何在 Windows 命令行中使用参数运行 Python 脚本

这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
如何解决 PDFBox 没有 unicode 映射错误？

我有一个现有的 PDF 文件我想使用 python 脚本将其转换为 Excel 文件目前正在使用PDFBox 但是存在多个类似以下错误 org apache pdfbox pdmodel font PDType0Font toUnico
在本地网络上运行 Bokeh 服务器

我有一个简单的 Bokeh 应用程序名为app py如下 contents of app py from bokeh client import push session from bokeh embed import server do
模拟pytest中的异常终止

我的多线程应用程序遇到了一个错误主线程的任何异常终止例如未捕获的异常或某些信号都会导致其他线程之一死锁并阻止进程干净退出我解决了这个问题但我想添加一个测试来防止回归但是我不知道如何在 pytest 中模拟异常终止如果我只
Kivy - 单击按钮时编辑标签

我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo

随机推荐

Sqlite 与 Blazor Wasm (.NET 6) -> System.DllNotFoundException: e_sqlite3

根据 NET 6 中的新 Blazor WebAssembly 功能 NET 6 中的新 Blazor WebAssembly 功能 Sqlite 与 Blazor Wasm NET 6 gt System DllNotFoundExcep
jQuery 通过单击链接来排列 li 顺序

需要通过点击向上移动或向下移动来改变li位置 div ul li Item1 a class moveUp Move Up a a class moveDown Move Down a li li Item2 a class moveUp
有人可以解释 Blazor 组件标签的各种语法吗

在我的 razor 文件中我有这些标签只是一个示例它们有效但我无法向自己解释各种语法背后的原因
来自 Microsoft Graph 的多个更改通知

每当更新创建删除或编辑事件时我都尝试从 Microsoft Graph 接收更改通知我已成功创建订阅接收通知的 URL 属于 Azure Function 但是每当我创建或删除事件时图表都会针对一个特定更改发送多个通知正如
Cocoa 结构体和 NSMutableArray

我有一个 NSMutableArray 我正在尝试存储和访问一些结构我该怎么做呢 addObject 给我一个错误说 addObject 的参数 1 的类型不兼容这是一个示例 in 是 NSFileHandle array 是 NSM
在 Windows 8/10 上调用静态链接函数每次都会崩溃，但在 Windows 7 上则不然

问题我已经建立了https github com reorg pg repack https github com reorg pg repack生成二进制文件的项目该二进制文件与 postgres 9 6 可再发行组件链接我使用由
使用 @EmbeddedKafka 时执行 @DirtiesConfig 的正确方法是什么

我们的项目中有一个小问题无法建立与节点 0 的连接代理可能不可用测试运行非常非常长的时间并且该消息每秒至少记录一次但我发现如何摆脱它请继续阅读如果配置注释有不正确的地方请告诉我版本优先
EXC_BAD_ACCESS 使用 gmaps sdk 1.9.0，Xcode 6.4，在 8.3 设备上运行

我有 2 个使用 google 地图 sdk 的项目它们目前位于 Appstore 中需要注意的事项通过cocoapods安装的Gmaps sdk版本1 9 0 Xcode 版本 6 4 部署目标 7 1 设备 iPhone 4s 8
将变量从中间件传递到模板

我是 Django 初学者到目前为止我学到了传递变量view to template 但现在我需要将变量传递到我的主布局我可以在视图中的每个页面的定义中传递它但它的重复太多了于是我开始学习中间件我创建了 middlewares p
VBA 打开多个工作簿、复制特定数据、删除重复行并将信息粘贴到新工作簿中

我知道标题不太清楚但我希望我能在这个描述中更好地解释它我是 VBA 新手我需要编写一些执行以下操作的代码打开特定文件夹中的多个工作簿并将信息从源工作表仅一个活动工作表中间的表复制到新工作簿中的目标 Sheet1 问题 1 表的
有没有办法让 xsd.exe 生成具有“内部”范围的类？

我有一个 DLL 其中包含一些 XSD 生成的类不幸的是 XSD exe 将这些类公开这会导致缺少公开可见类型或成员 XYZ 的 XML 注释警告另外我不想从我的 DLL 中公开这些类有没有办法除了手动编辑生成的 cs 之外
如何通过T-SQL在SQL Server 2008中创建计划作业？

我想创建一个作业在一段时间过去后从数据库中删除记录例如我在新闻表中有一个字段Time Stamp每个月都会有一个 SQL 查询像计划作业一样针对我的数据库运行并删除时间戳为两个月前的新闻一般来说我想删除两个月前或更早的新闻以免我
克隆与实例化新类

在这种情况下克隆是好的做法吗怎样才能做得更好呢 public ModelCollection startParsing return parseFeed new ModelSpecialEntry public ModelCollect
数据库模式混乱

当我设计一些类时我遇到了轻微的术语混乱在 Sql Server 2005 中架构指的是数据库对象的命名空间和组织系统但对于一般的关系数据库来说模式意味着表字段等的 DDL 设计如果我的观点是正确的那么它解释了当我尝试阅读
哪个STL容器？

我需要一个容器不一定是 STL 容器它可以让我轻松执行以下操作在任意位置插入和移除元素通过索引访问元素以任意顺序迭代元素 I used 标准列表但它不会让我在任何位置插入确实如此但为此我必须迭代所有元素然后在我想要的位置
将日期从 MySQL 正确导入到 R 中

我的问题几乎相同正如这个 https stackoverflow com questions 27597932 databse connection using dplyr with date field in databse 简而言之我
在 NULL 表示为 0 的平台上，编译器是否曾经生成过 NULL <= p 的意外代码

在 C99 中平等似乎从来没有未定义过它可以产生1如果您意外地将其应用到无效地址例如 x 1 y可能是偶然的事实它不会产生未定义的行为许多但不是全部无效地址未定义为根据标准计算使用因此p x with p悬空指针或者
CSS 中的“缩放”有什么作用？

我发现一些 jQuery 插件在他们的 css 规则中使用了 zoom 描述符我什至查看了 w3c 网站发现它是用来放大的但我该如何实际实现它呢或者我必须定义一些视口我如何定义这样的视口或者我对整个事情都错了是否可以像这样使用
Blowfish 在 Java/Scala 中加密并在 bash 中解密

我正在尝试构建一个工具来解密在 scala 应用程序中加密的 bash 内容但首先我必须成功地用两种语言对相同的消息进行编码并使它们相等给定密码 0123456789abcdef 十六进制 3031323334353637383961
为什么具有单个组的数据帧 groupby 不返回数据帧？

我怀疑这是我的问题的更简单形式here https stackoverflow com questions 18518077 why does pandas groupby cut give different form of output

为什么具有单个组的数据帧 groupby 不返回数据帧？

为什么具有单个组的数据帧 groupby 不返回数据帧？ 的相关文章

随机推荐

热门标签

为什么具有单个组的数据帧 groupby 不返回数据帧？的相关文章