Using random.shuffle
,我注意到洗牌list(range(n))
比洗牌多花费约 25% 的时间[0] * n
。这是尺寸的时间n
从 100 万到 200 万:
为什么是洗牌list(range(n))
慢点?与对列表进行排序(需要查看对象)或复制列表(增加对象内部的引用计数器)不同,对象在这里不重要。这应该只是重新排列列表内的指针。
我也尝试过numpy.random.shuffle
,其中洗牌list(range(n))
比洗牌慢三倍(!)[0] * n
:
我还尝试了第三种方法来重新排列列表中的元素,即list.reverse
。正如预期的那样,两个列表花费的时间相同:
以防万一洗牌顺序很重要,我也尝试过list.reverse
重新整理列表后。同样,正如预期的那样,两个列表花费的时间相同,并且与没有事先进行改组的时间相同:
那么有什么区别呢?混排和反转都只需要重新排列列表内的指针,为什么对象对于混排很重要,而对于反转则不重要?
我的基准代码生成时间:
import random
import numpy
from timeit import repeat, timeit
from collections import defaultdict
shufflers = {
'random.shuffle(mylist)': random.shuffle,
'numpy.random.shuffle(mylist)': numpy.random.shuffle,
'list.reverse(mylist)': list.reverse,
}
creators = {
'list(range(n))': lambda n: list(range(n)),
'[0] * n': lambda n: [0] * n,
}
for shuffler in shufflers:
print(shuffler)
for creator in creators:
print(creator)
times = defaultdict(list)
for _ in range(10):
for i in range(10, 21):
n = i * 100_000
mylist = creators[creator](n)
# Uncomment next line for pre-shuffling
# numpy.random.shuffle(mylist)
time = timeit(lambda: shufflers[shuffler](mylist), number=1)
times[n].append(time)
s = '%.6f ' * len(times[n])
# Indent next line further to see intermediate results
print([round(min(times[n]), 9) for n in sorted(times)])