当出现平局时，熊猫如何决定排序顺序？

2023-11-24

熊猫0.12.0

例如，在下面的 DataFrame 中，为什么它会混淆索引？看一下 4，索引从 1,15,6,7 开始。 pandas 用于决定如何排序的推理是什么，我怀疑索引会保持顺序以获得相等的值。

mydf=pd.DataFrame(np.random.randint(1, 6, 20),columns=["stars"])
mydf.sort(['stars'], ascending=False)


     stars
19   5
14   5
1    4
15   4
6    4
7    4
4    3
12   3
18   3
8    2
2    2
9    2
10   2
11   2
13   2
16   2
5    1
3    1
17   1
0    1

事实上，如果你仔细研究一下pandas DataFrame 源代码，你会看到sort()只是一个包装排序索引()具有不同的参数，并且，正如@Jeff 所说这个问题, 排序索引()是首选使用方法。

sort_index() 方法使用numpy.argsort()默认情况下kind=quicksort，如果您仅按一列排序。和快速排序() is not stable，这就是你的索引看起来混乱的原因。

但你可以通过kindsort_index() 的参数（其中之一'mergesort', 'quicksort', 'heapsort'），所以你可以使用稳定排序（'mergesort'）为您的任务：

>>> mydf.sort_index(by=['stars'], ascending=False, kind='mergesort')
    stars
17      5
11      5
6       5
1       5
19      4
18      4
15      4
14      4
7       4
5       4
2       4
10      3
8       3
4       3
16      2
12      2
9       2
3       2
13      1
0       1

如果有不止一列，sort_index() 也使用归并排序（或计数排序）by参数，很有趣，例如，你可以这样做：

>>> mydf.sort_index(by=['stars', 'stars'], ascending=False)
    stars
1       5
6       5
11      5
17      5
2       4
5       4
7       4
14      4
15      4
18      4
19      4
4       3
8       3
10      3
3       2
9       2
12      2
16      2
0       1
13      1

现在排序稳定了，但索引按升序排序

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

当出现平局时，熊猫如何决定排序顺序？的相关文章

如何从Python中的阿拉伯字符串中删除英文文本？

我有一个带有英文文本和标点符号的阿拉伯字符串我需要过滤阿拉伯文本我尝试使用 sting 删除标点符号和英语单词但是我失去了阿拉伯语单词之间的空格我哪里错了 import string exclude set string punc
如何使用 Julia 查找矩阵中的连通分量

假设我有以下矩阵此处用 Julia 语言定义 mat 1 1 0 0 0 1 1 0 0 0 0 0 0 0 1 0 0 0 1 1 将一组值为 1 的相邻元素视为一个分量如何识别该矩阵有 2 个分量以及每个分量由哪些顶点组成对于矩
Heroku 上的 Django 应用程序在一段时间后删除对象

我编写了一个简单的 Django 问答论坛应用程序并将其部署在 Heroku 上该网站的本地版本运行良好但是生产版本不会将问题答案等存储超过几个小时我决定坚持使用 Django 附带的 sqlite3 我预计该网站不会有太多流量
numpy：与索引数组有效求和

假设我有 2 个矩阵 M 和 N 都有 gt 1 列我还有一个索引矩阵 I 有 2 列 1 列代表 M 一列代表 N N 的索引是唯一的但 M 的索引可能出现多次我想要执行的操作是 for i j in w M i N j 除了 fo
使用 scikit-learn 在朴素贝叶斯分类器中混合类别数据和连续数据

我正在使用 Python 中的 scikit learn 开发分类算法来预测某些客户的性别除此之外我想使用朴素贝叶斯分类器但我的问题是我混合了分类数据例如在线注册接受电子邮件通知等和连续数据例如年龄长度会员资格等
如何使用 matplotlib 面向对象的 API 设置轴刻度和刻度标签

我需要一些在 Python2 7 下的 Matplotlib pyplot 中绘图的帮助我想生成一个具有以下 x 轴的图 x 轴应该是这样 https i stack imgur com zcosX jpg 我到目前为止通过使用myaxi
Python：当为变量分配新内容时，“旧”内存是否被释放？

如果为变量分配了任何新内容为旧内容分配的内存是否会正确释放例如在以下脚本中在为 a 分配一些新内容后变量 a 作为零数组的内存是否会被释放 import numpy a numpy zeros 1000 a a 1 我想象
在 Tkinter 中调整另一个小部件内的一个小部件的大小

我正在开发穆斯堡尔光谱化学的模拟软件但在设计 UI 时我在使用父窗口小部件调整子窗口小部件的大小时遇到了问题当窗口最大化时父框架会填充额外的空间但子窗口小部件不会更改其大小 from Tkinter import impor
argparse - 禁用相同参数的出现

我正在尝试使用 argparse 禁用一个命令行中出现相同的参数 python3 argument1 something argument2 argument1 something else 这意味着这应该会引发错误因为 argument
忽略覆盖率报告中的空文件

覆盖率 py https github com nedbat coveragepy会包括 init py在其报告中并将其显示为 0 行但覆盖率为 100 我想从覆盖率报告中排除所有空白文件我不能只添加 init py to omit作为
Netmiko OSError：在 send_command 中从未检测到搜索模式：

我被这个错误困住了任何人都可以帮助摆脱这个错误 import netmiko Device host xxxxxxxxxx device type cisco nxos username admin password xxxxxxxx c
使用存储的密钥作为环境变量

我有一个秘密密钥存储在 GCP 的秘密管理器中我们的想法是使用该密钥通过云功能获取预算列表现在我可以从代码中访问该密钥但我面临的问题是我需要使用该密钥设置一个环境变量这是我添加密钥的方式如果您的本地目录中有该文件但是还有其他方
sqlalchemy，使用反向包含（不在）子列值列表中进行选择

我在flask sqlalchemy 中有一个典型的帖子标签与一篇帖子相关的许多标签关系并且我想选择我提供的列表中未标记任何标签的帖子首先我建立的模型 class Post db Model id db Column db In
从 Java 调用 Python 代码时出现问题（不使用 jython）

我发现这是从 java 运行使用 exec 方法 python 脚本的方法之一我在 python 文件中有一个简单的打印语句但是我的程序在运行时什么也没做它既不打印Python文件中编写的语句也不抛出异常程序什么都不做就终止了
如何更改Python中的全局变量[重复]

这个问题在这里已经有答案了我正在尝试更改程序中的变量我在程序开始时声明了一个全局变量我想在程序中的不同函数中更改该变量我可以通过再次声明函数内的变量来做到这一点但我想知道是否有更好的方法来做到这一点下面是一些测试代码来解释我的意
为什么我只能在异步函数中使用await关键字？

假设我有这样的代码 async def fetch text gt str return text async def show something something await fetch text print something 这很
使用 python pyad 访问对象 [] 时出现问题

我在尝试使用 pyad 访问活动目录用户属性时遇到问题这是我的代码 user pyad aduser ADUser from cn tuser print user get attribute lastLogonTimestamp 这些是
在 kivy 中嵌套小部件

我正在尝试在 kivy 中制作一个界面我认为即使在完成教程之后我仍然不了解自定义小部件以及如何对它们进行层次结构的一些基本知识我认为我有更多的盒模型 html 思维方式因此小部件嵌套在本机 GUI 中的方式对我来说仍然有点陌生一些
使用 Python PuLP 混合整数规划的时间限制

我一直在使用PuLP http pythonhosted org PuLP 解决我感兴趣的特定混合整数线性规划 MIP 但是随着问题规模的增长 PuLP 花费的时间太长我希望能够运行求解器一段时间并在需要很长时间的情况下提前终止它并
关闭 IPython Notebook 中的自动保存

我正在寻找一种方法来关闭 iPython 笔记本中的自动保存我已经通过 Google Stack Overflow 搜索看到了有关如何打开自动保存的参考资料但我想要相反的内容关闭自动保存如果这是可以永久设置的东西而不是在每个笔记本的

随机推荐

Docker + Rspec + Capybara - 参数 [0] 未定义

我试图让我的规格在 docker 中无头工作它们在我的 mac 上本地运行良好但是当我在 docker 容器内运行它们时我收到此错误重复多次 Selenium WebDriver Error JavascriptError argu
Laravel 4：对如何使用 App::make() 感到困惑

我正在尝试遵循本文中概述的存储库模式http code tutsplus com tutorials the repository design pattern net 35804 highlighter 174798我正在尝试使用 App
在 web.xml 中将 servlet 设置为默认主页[重复]

这个问题在这里已经有答案了我有一个 servlet 注册在web xml如下
PHP 中的连接 ECHO 语法

我做了一个小功能 WordPress 使用echo Some code switch linktype case next echo p class next previous post link link prevthumbnail p
在跨平台应用程序中使用 snprintf

我正在编写一个 C 程序预计可以使用所有主要编译器进行编译目前我正在 Linux 机器上的 GCC 上进行开发并在提交代码之前在 MSVC 上进行编译为了使交叉编译变得容易我正在编译 ansi and pedantic旗帜这很有
ASP.NET Identity（使用IdentityServer4）获取外部资源oauth访问令牌

我已经阅读了 IdentityServer4 的文档并将其设置为使用 Microsoft Office 365 作为登录提供程序当用户登录后我想创建一个按钮他可以在其中允许我的应用程序使用 graph microsoft com 的
以编程方式获取代码的 Big-O 效率

我想知道是否有任何自动方法可以至少粗略地确定给定函数的 Big O 时间复杂度如果我绘制 O n 函数与 O n lg n 函数的图表我想我将能够直观地确定哪个是哪个我认为必须有一些启发式解决方案可以自动完成此操作有任何想法吗
“import foo.*”不应该包含子包“foo.bar.*”吗？

在学习 Java 时我想到了许多教程中相当令人困惑的属性考虑示例教程中的以下两个导入 import java awt import java awt event 第一行显然导入了 java awt 包第二行导入了 awt 的子包但是
mongoose.connection() 和 mongoose.createConnection() 之间的混淆

我已经研究了 mongoose 三天对这两种方法的使用有点困惑我知道 mongoose connection 将来会被弃用问题是当我尝试转换从 mongoose connection 到 mongoose createConnec
GCDAsyncUdpSocket 与组播发送和接收

在第一种方法中我创建客户端服务器应用程序基于样本项目将一些数据发送到服务器 Legend sender address reciver ip port reciver port reciver address null since
具有不可编辑/不可取消后缀的 EditText [重复]

这个问题在这里已经有答案了我为我的一项活动创建了一个布局用户可以在其中的某些 EditText 小部件中插入值我需要其中一些 EditText 必须具有不可编辑的后缀如 cm mm 等用户插入值后我将解析这些 EditText
JavaScript 在 ul 中查找 li 索引

我正在尝试通过 Javascript 中的 id 查找列表项的索引例如我有 5 个项目的列表给定一个元素我想找出它在列表中的位置下面是我希望构建的代码它使用 onclick 处理程序来查找正在工作的元素然后我只需要以某种方式找
Sequelize targetKey 不起作用

我正在尝试使用sequelize关联两个模型 Note 和 Resource 但是 targetKey 没有按预期工作注意模态 module exports function sequelize DataTypes return sequ
解构深层属性

我最近开始使用 ES6解构赋值语法并开始熟悉这个概念我想知道是否可以使用相同的语法提取嵌套属性例如假设我有以下代码 let cagingIt foo bar Nick Cage 我知道我能够访问摘录foo通过执行以下操作将其放入变量中
使用 API 的 Ionic 3 登录身份验证 - 无法读取 null 的属性“json”

我正在使用 API 在 Ionic 3 中进行身份验证但在登录过程中它显示错误无法读取 null 的属性 json 这是我的providers gt restapi gt restapi ts import HttpClient fr
客户端发送的请求语法错误 ().+Spring , RESTClient

我正在使用 JSON 对象使用 Spring MVC 当我尝试从 RESTClient 发送 JSON 对象时我得到 HTTP 状态 400 客户端发送的请求在语法上不正确这是我的控制器 ObjectMapper mapper new
.net core (csproj) global.json 'projects' 等效项

使用 net core project json 我曾经通过将源代码的路径添加到 nuget 包和源代码之间进行切换projectsglobal json 中的字段完成此操作后它将添加它可以在该路径中找到的所有项目这些项目可以替换我引
使用 Delaunay 三角剖分进行插值

有一个形状像某种扭曲抛物面的浊点我想使用 Delaunay 三角剖分来插值这些点我尝试过其他技术例如样条线但没有设法强制执行所需的行为我想知道是否有一种快速的方法来使用结果scipy spatial Delaunay我可以给出 x
“初始化 Java 工具”期间发生内部错误。在 Eclipse 启动时

我在启动时遇到这个奇怪的错误我的环境可能出了什么问题这是错误 gt ENTRY org eclipse core jobs 4 2 2010 12 30 17 56 32 545 MESSAGE An internal error oc
当出现平局时，熊猫如何决定排序顺序？

熊猫0 12 0 例如在下面的 DataFrame 中为什么它会混淆索引看一下 4 索引从 1 15 6 7 开始 pandas 用于决定如何排序的推理是什么我怀疑索引会保持顺序以获得相等的值 mydf pd DataFrame n

当出现平局时，熊猫如何决定排序顺序？

当出现平局时，熊猫如何决定排序顺序？ 的相关文章

随机推荐

热门标签

当出现平局时，熊猫如何决定排序顺序？的相关文章