为什么洗牌 list(range(n)) 比洗牌 [0]*n 慢？

2023-12-25

Using random.shuffle，我注意到洗牌list(range(n))比洗牌多花费约 25% 的时间[0] * n。这是尺寸的时间n从 100 万到 200 万：

为什么是洗牌list(range(n))慢点？与对列表进行排序（需要查看对象）或复制列表（增加对象内部的引用计数器）不同，对象在这里不重要。这应该只是重新排列列表内的指针。

我也尝试过numpy.random.shuffle，其中洗牌list(range(n))比洗牌慢三倍（！）[0] * n:

我还尝试了第三种方法来重新排列列表中的元素，即list.reverse。正如预期的那样，两个列表花费的时间相同：

以防万一洗牌顺序很重要，我也尝试过list.reverse重新整理列表后。同样，正如预期的那样，两个列表花费的时间相同，并且与没有事先进行改组的时间相同：

那么有什么区别呢？混排和反转都只需要重新排列列表内的指针，为什么对象对于混排很重要，而对于反转则不重要？

我的基准代码生成时间：

import random
import numpy
from timeit import repeat, timeit
from collections import defaultdict

shufflers = {
    'random.shuffle(mylist)': random.shuffle,
    'numpy.random.shuffle(mylist)': numpy.random.shuffle,
    'list.reverse(mylist)': list.reverse,
    }

creators = {
    'list(range(n))': lambda n: list(range(n)),
    '[0] * n': lambda n: [0] * n,
    }

for shuffler in shufflers:
    print(shuffler)
    for creator in creators:
        print(creator)
        times = defaultdict(list)
        for _ in range(10):
            for i in range(10, 21):
                n = i * 100_000
                mylist = creators[creator](n)
                # Uncomment next line for pre-shuffling
                # numpy.random.shuffle(mylist)
                time = timeit(lambda: shufflers[shuffler](mylist), number=1)
                times[n].append(time)
                s = '%.6f ' * len(times[n])
        # Indent next line further to see intermediate results
        print([round(min(times[n]), 9) for n in sorted(times)])

（注意：我没有时间完成这个答案，所以这是一个开始——这绝对不适合评论，希望它可以帮助其他人完成这个问题！）

这似乎是由于引用的局部性（也许是 cpython 实现细节——例如，我在 pypy 中没有看到相同的结果）

在尝试解释之前先看几个数据点：

random.shuffle https://github.com/python/cpython/blob/61ac612e78e4f2625977406fb6f366e0a644673a/Lib/random.py#L304-L324是用纯 python 实现的，适用于任何可变序列类型——它不是专门用于列表的。

这意味着每次交换都涉及__getitem__，增加商品的重新计数，__setitem__，减少项目的重新计数

list.reverse https://github.com/python/cpython/blob/61ac612e78e4f2625977406fb6f366e0a644673a/Objects/listobject.c#L1023-L1037用 C 实现，仅适用于list（使用列表的实现细节）

这意味着每次交换都在不调用的情况下发生__getitem__或更改引用计数。列表的内部项目直接重新排列

重要的是引用计数

在 cpython 中，引用计数与对象本身一起存储 https://github.com/python/cpython/blob/61ac612e78e4f2625977406fb6f366e0a644673a/Include/object.h#L105-L109，并且几乎所有对象都存储在堆中。为了调整引用计数（即使是暂时的）写入ob_refcnt将分页在PyObject结构到缓存/内存/等中。

（这是我没时间的地方——我可能会做一些内存故障分析来证实这个假设）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么洗牌 list(range(n)) 比洗牌 [0]*n 慢？的相关文章

使用 Marshmallow 中的数据更新行 (SQLAlchemy)

我正在使用 Flask Flask SQLAlchemy Flask Marshmallow marshmallow sqlalchemy 尝试实现 REST api PUT 方法我还没有找到任何使用 SQLA 和 Marshmallow
如何将经度和纬度转换为国家或城市？

我需要将经度和纬度坐标转换为国家或城市 python中有这样的例子吗提前致谢我使用谷歌的API from urllib2 import urlopen import json def getplace lat lon url http
简单的Java程序插入USB热点后速度慢100倍

我有以下Java程序 class Main public static void main String args throws java io IOException long start System nanoTime java io
按 ListProperty (NDB) 对查询进行排序

如何按 ListProperty 对查询进行排序该模型 class Chapter ndb Model title ndb StringProperty required True version ndb IntegerProperty
使用 GeoDjango 在坐标系之间进行转换

我正在尝试将坐标信息添加到我的数据库中添加django contrib gis支持我的应用程序我正在写一个south数据迁移从数据库中获取地址并向 Google 询问坐标到目前为止我认为我最好的选择是使用geopy为了这接下来
垂直线 axvline 在 matplotlib 的 loglog 图中绘制位于错误位置的线

我在使用 axvline 在 matplotlib 的 loglog 图中绘制垂直线时遇到问题第一个问题是垂直线没有出现在正确的位置第二个问题可能相关的是当我放大或平移绘图时垂直线只是保持在原位并且没有通过平移滑动绘图或放大
在一张图中同时绘制两个截面强度

我有一个形状数组 512 512 看起来像行 x 列 y 密度 z 数组的数量 0 012825 0 020408 0 022976 0 015938 0 02165 0 024357 0 036332 0 031904 0 025462
将 stdout 重定向到 Python 中的文件？ [复制]

这个问题在这里已经有答案了如何将 stdout 重定向到 Python 中的任意文件当长时间运行的 Python 脚本例如 Web 应用程序从 ssh 会话内启动并处于后台并且 ssh 会话关闭时应用程序将引发 IOError
如何在 Julia 中有效计算二次形式？

我想计算一个二次形式 x Q y在朱莉娅对于这种情况计算此值的最有效方法是什么没有假设 Q是对称的 x and y是相同的 x y Both Q是对称的并且x y 我知道朱莉娅有dot 但我想知道它是否比 BLAS 调用更快现有的答
Python - 为什么这段代码被视为生成器？

我有一个名为 mb 的列表其格式为 Company Name Rep Mth 1 Calls Mth 1 Inv Totals Mth 1 Inv Vol Mth 2 等等在下面的代码中我只是添加了一个包含 38 个 0 的新列表这
如何通过 Python socket.send() 发送字符串以外的任何内容

我对 Python 编程非常陌生但出于必要我必须快速地将一些东西组合在一起我正在尝试通过 UDP 发送一些数据除了当我执行 socket send 时我必须以字符串形式输入数据之外一切都正常这是我的程序这样你就可以看到我在做
Python NLP 英式英语与美式英语

我目前正在用Python 进行NLP 工作然而在我的语料库中既有英式英语也有美式英语实现实现我正在考虑将英式英语转换为美式英语但是我没有找到一个好的工具包来做到这一点有什么建议么我也找不到包但试试这个请注意我必须
将 JSON 字符串传递给 Django 模板

我一直在用头撞墙试图找出为什么我无法将从 Django 模型生成的 JSON 字符串传递到模板的 javascript 静态文件中事实证明问题不在模型级别使用serializers serialize 在脚本本身中放入相同的字符串将
超时时杀死或终止子进程？

我想尽可能快地重复执行子进程然而有时这个过程会花费太长的时间所以我想杀死它我使用 signal signal 如下所示 ppid pipeexe pid signal signal signal SIGALRM stop handl
如何在Python中获取绝对文件路径

给定一条路径例如 mydir myfile txt 如何在Python中找到文件的绝对路径例如在 Windows 上我最终可能会得到 C example cwd mydir myfile txt gt gt gt import os
如何在 Numpy 中实现垃圾收集

我有一个名为main py 它引用另一个文件Optimisers py它仅具有功能并用于for循环进入main py 这些函数都有不同的优化功能 This Optimisers py然后引用另外两个类似的文件其中也只有函数它们位于whi
Pandas - 分割大的Excel文件

我有一个大约有 500 000 行的 Excel 文件我想将其拆分为多个 Excel 文件每个文件有 50 000 行我想用熊猫来做这样它会是最快和最简单的有什么想法如何制作吗感谢您的帮助假设您的 Excel 文件只有一个第
为什么 C# 编译的正则表达式比等效的字符串方法更快？

每次我必须对字符串执行简单的包含或替换操作其中我正在搜索的术语是固定值时我发现如果我获取示例输入并对其进行一些分析则使用编译的正则表达式是几乎总是比使用 String 类中的等效方法更快我尝试过比较多种方法 hs是要搜索的干草
带有整数的 np.sqrt 和 where 条件返回错误结果

当我将 numpy sqrt 方法应用于带有 a 的整数数组时我得到了奇怪的结果where健康状况见下文对于整数 a np array 1 4 9 np sqrt a where a gt 5 Out 3 array 0 0 5 3
如何在 Python 中解析损坏的 XML？

我无法影响的服务器发送的 XML 非常损坏具体来说 Unicode WHITE STAR 将被编码为 UTF 8 E2 98 86 然后使用 Latin 1 转换为 HTML 实体表我得到的是 acirc 98 86 9 个字节位于声

随机推荐

添加 androidx.fragment:fragment-testing 依赖项后 AndroidTests 停止构建

我添加后fragment testing对我的项目的依赖 Testing dependencies espressoVersion 3 2 0 beta01 testCoreVersion 1 1 0 runnerVersion 1 1 0
如何在 C# 中使用 SevenZipSharp/Unrar 知道哪个 rar 是多个 rar 存档中的第一个？

我正在尝试在 C WinForms NET 3 5 中使用 SevenZipSharp 或和 Unrar 库我遇到了具有不同命名的多个 rar 存档的问题例如 rar r01 r02 r03 等这很简单 somefile01 rar
“免费”的冲突类型

我收到错误免费的冲突类型打电话给free 下面的函数 int main char fx x 2 5 x 1 node fxNode buildTree fx sizeof fx sizeof char printf deriveFro
Portlet 桥有什么作用？

在今天的一次采访中我提到我在 portlet 中完成了一些 jsf 工作面试官询问了 portlet bridge 的具体功能我从来没有深入研究过它只是使用它因为我被告知它可以让 jsf 在 portlet 中工作我真正能说的是
“CSV 不存在”-Pandas DataFrame [重复]

这个问题在这里已经有答案了我在将 csv 文件读入 pandas 数据框中时遇到困难我是 pandas 的新手这阻碍了我的进步我已阅读文档并搜索解决方案但无法继续我已经尝试过以下方法但无济于事 import pandas as
POCO、DTO、DLL 和贫血域模型

我正在看POCO和DTO的区别 https stackoverflow com questions 725348 poco vs dto 看起来 POCO 是具有行为方法的 dto 并遇到本文 http www martinfowler
在 VS2008 中调试 Windows x64 上的 x86 .NET 应用程序

我使用 x64 版本的 Windows 7 我的应用程序使用一些无法在 x64 上下文中加载的 COM 服务器通常是本机 x86 COM 服务器所以我决定将其作为 x86 应用程序运行WOW http en wikipedia org
Oracle SQL如何找出哪个表有以下两列？

我知道我可以发出一个声明来查找包含我正在查找的列的表 SELECT DISTINCT table name FROM all tab cols WHERE column name EMP ID 但是我应该如何修改它以便我可以找到两者都说
SQL Server：根据提供的行值为每行运行函数

我仍在学习 SQL 我在想如何将行值传递到一个函数中cross apply query 假设这是我的第一张桌子 SELECT Project emp id Allocation start Allocation end FROM First
Next Auth.js 令牌长度和 Cognito 的问题

我正在尝试使用 NextAuth js 和 Cognito 在我的 Next js 应用程序中实现身份验证这是我的问题当调用 jwt 回调时我想在会话中存储 3 个令牌和其他内容但令牌最大长度为 4096 字节我怎样才能实现这个
添加单个字符以在 Counter 中添加键

如果 Counter 对象的键的类型是str i e 我可以这样做 gt gt gt vocab counter Counter the lazy fox jumps over the brown dog split gt gt gt vo
Python：打印一个简单的函数[重复]

这个问题在这里已经有答案了我是 Python 和一般编程的绝对初学者而且我刚刚第一次接触函数我在下面定义了两个简单的函数 def output1 print Hello world def output2 print Hello th
ValueError：操作数无法与形状 (5,) (30,) 一起广播

我正在尝试像这样合并数组 If a 1 2 1 3 4 b 0 0 0 0 c 0 0 0 0 a a b c 那么结果应该是 0 0 0 0 1 2 1 3 4 0 0 0 0 我所做的是提取数组的直方图并将其与普通数组合并 x1 bi
找不到文件 mysql-connector-java-5.1.13-bin.jar

您好当我尝试从 netbeans 站点运行 sakila 数据库示例时https netbeans org projects samples downloads download Samples JavaEE DVDStoreEE6 zi
TIdHTTP：选择 HTTP 请求的传出 IP？

我有一台机器有几个不同的静态IP 是否可以通过以下方式选择 HTTP 请求的传出 IP 地址TIdHTTP Indy 印地的新版本有BoundIP idHttp1 BoundIP 144 33 34 212
在类型系统的上下文中什么是“种类”？

我已经阅读了维基百科文章并搜索了明显的地方但我被困住了有人可以简单地告诉我 Kind 到底是什么吗它是干什么用的 Scala 示例最受欢迎简而言之 kind is to types what a type is to values
禁止系统使用 Meteor 帐户？

我正在使用 Meteor 开发一个聊天应用程序它使用 account ui 和 account twitter 我希望能够禁止人们滥用该网站但我不确定如何做到这一点或者是否可能有没有办法做到这一点这是我用来运行聊天应用程序部分的代
ScrollView 布局或其RelativeLayout 父级可能没用

我正在开发 Android 4 及以上版本的应用程序一层生成此警告此 ScrollView 布局或其relativelayout 父级可能是无用的将背景属性传输到另一个视图
使用 css 设置表格中最后一个 td 的样式

我想设置表中最后一个 TD 的样式而不在特定 TD 上使用 CSS 类 table tbody tr td One td td Two td td Three td td Four td td Five td tr tbody table
为什么洗牌 list(range(n)) 比洗牌 [0]*n 慢？

Using random shuffle 我注意到洗牌list range n 比洗牌多花费约 25 的时间 0 n 这是尺寸的时间n从 100 万到 200 万为什么是洗牌list range n 慢点与对列表进行排序需要查看对象

为什么洗牌 list(range(n)) 比洗牌 [0]*n 慢？

为什么洗牌 list(range(n)) 比洗牌 [0]*n 慢？ 的相关文章

随机推荐

热门标签

为什么洗牌 list(range(n)) 比洗牌 [0]*n 慢？的相关文章