为什么在 Python 中处理已排序数组并不比处理未排序数组快？

2024-02-25

在这篇文章中为什么处理排序数组比处理随机数组更快 https://stackoverflow.com/questions/11227809/why-is-processing-a-sorted-array-faster-than-an-unsorted-array，它说分支预测是排序数组性能提升的原因。

但我只是用Python尝试了这个例子；我认为排序数组和随机数组之间没有区别（我尝试了 bytearray 和 array；并使用 line_profile 来分析计算）。

我错过了什么吗？

这是我的代码：

from array import array
import random
array_size = 1024
loop_cnt = 1000
# I also tried 'array', and it's almost the same
a = bytearray(array_size)
for i in xrange(array_size):
    a.append(random.randint(0, 255))
#sorted                                                                         
a = sorted(a)
@profile
def computation():
    sum = 0
    for i in xrange(loop_cnt):
        for j in xrange(size):
            if a[j] >= 128:
                sum += a[j]

computation()
print 'done'

我可能是错的，但我看到链接的问题和您的示例之间存在根本区别：Python 解释字节码，C++ 编译为本机代码。

在 C++ 代码中if直接翻译成cmp/jl序列，CPU 分支预测器可以将其视为特定于该周期的单个“预测点”。

在Python中，比较实际上是几个函数调用，所以有（1）更多的开销，（2）我认为执行该比较的代码是解释器中用于每个其他整数比较的函数 - 所以它是一个“预测点”而不是特定于当前块，这使得分支预测器更难正确猜测。

Edit: 另外，如中所述this http://www.jilp.org/vol5/v5paper12.pdf论文中，解释器内部有更多的间接分支，因此 Python 代码中的这种优化可能会被解释器本身的分支错误预测所掩盖。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

performance

为什么在 Python 中处理已排序数组并不比处理未排序数组快？的相关文章

C++ Exp 与 Log：哪个更快？

我有一个 C 应用程序需要比较两个值并决定哪个值更大唯一的复杂之处是一个数字在对数空间中表示而另一个则不是例如 double log num 1 log 1 23 double num 2 1 24 如果我想比较num 1 and
Python Popen 与 psexec 挂起 - 不良结果

我对 subprocess Popen 和我认为是管道的问题有疑问我有以下代码块从 cli 运行时 100 都不会出现问题 p subprocess Popen psexec serverName get cmd c ver echo
django_openid_auth TypeError openid.yadis.manager.YadisServiceManager 对象不是 JSON 可序列化

I used django openid auth在我的项目上一段时间以来它运行得很好但今天我测试了该应用程序并遇到了这个异常 Environment Request Method GET Request URL http local
在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
从零开始的 numpy 形状意味着什么

好的我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况这对我来说是有意义的它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑为什么这么定义呢据我所知这只是表达空数组的
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
如何通过在 Python 3.x 上按键来启动和中断循环

我有这段代码当按下 P 键时会中断循环但除非我按下非 P 键否则循环不会工作 def main openGame while True purchase imageGrab if a sum gt 1200 fleaButton ti
对图像块进行多重处理

我有一个函数必须循环遍历图像的各个像素并计算一些几何形状此函数需要很长时间才能运行在 24 兆像素图像上大约需要 5 小时但似乎应该很容易在多个内核上并行运行然而我一生都找不到一个有据可查解释充分的例子来使用 Multiproc
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
奇怪的 MySQL Python mod_wsgi 无法连接到 'localhost' (49) 上的 MySQL 服务器问题

StackOverflow上也有类似的问题但我还没有发现完全相同的情况这是在使用 MySQL 的 OS X Leopard 机器上一些起始信息 MySQL Server version 5 1 30 Apache 2 2 13 Uni
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
无法在前端使用 JavaScript Fetch API 将文件上传到 FastAPI 后端

我正在尝试弄清楚如何将图像发送到我的 API 并验证生成的token那是在header的请求到目前为止这就是我所处的位置 app post endreProfilbilde async def endreProfilbilde requ
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
检查字典键是否有空值

我有以下字典 dict1 city name yass region zipcode phone address tehsil planet mars 我正在尝试创建一个基于 dict1 的新字典但是它不会包含带有空字符串的键它不会包
如何清除 APC 缓存而不使 Apache 崩溃？

如果 APC 存储大量条目清除它们会导致 httpd 崩溃如果 apc clear cache user 花费的时间超过 phps max execution time 调用 apc clear cache 的脚本将在之前被 php

随机推荐

如何对 REST 视图类使用 @condition 装饰器

我正在尝试使用 ETAG HTTP 标头发送 304 NOT MODIFIED 响应使用以下代码 class MyView GenericAPIView serializer class MySerializer condition et
grails 将 svn 修订版添加到 app.version

我正在尝试将 svn 修订版添加到我的app version不需要 ant 或其他类似的外部工具看来我可以加入 Events groovy对此但文档相对较少有人知道怎么做吗 This http grails 1312388 n4 na
JApplet NoClassDefFoundError

我正在 Eclipse 上编写 Japplet 它时不时地停止在 html 页面上工作以下是错误 Exception in thread thread applet main MapGenerator class 1 java lang
有没有一种简单的方法可以从 .NET 用户控件中删除“ct100”前缀？

长话短说几十个页面没有使用母版页对于新模块我创建了一个带有菜单控件的母版页菜单控件已经存在这样我就可以在我现在创建的大约六个页面上获得相同的外观由于内容页使用母版页因此菜单控件的名称更改为ct100 Menu1而不仅仅是Men
使用 C# 编辑 DataGridview 并将其保存在数据库表中

我使用 MYSQL Server 作为我的项目后端我有一个 DataGridView 它填充了数据库中的数据当我在 DataGridView 单元格中进行更改并单击保存按钮时数据需要在 DataGridView 和数据库表中更改这是
新的CSS样式声明

我正在尝试使用浏览器的内置类型CSSStyleDeclaration以编程方式传递和修改样式这很方便因为 cssText财产然而 new CSSStyleDeclaration 抛出一个Illegal Constructor错误所以
Gradle 以非零退出值 1 完成

我刚刚在 libgdx 中生成了一个项目并导入到 eclipse 编译了一些依赖项现在我得到了 Error Gradle Execution failed for task android compileDebugAidl com and
如何选择自动完成下拉列表中的第一个元素

如果没有元素任何人都可以帮助我如何选择自动完成下拉列表的第一个元素被选中我尝试使用自动对焦为键盘事件工作如果我使用鼠标第一个元素不会选择自动聚焦的元素 visit here https stackoverflow com a 9
在 Swift 中使用 NSURL 读取文本文件

我想读取并显示位于 URL 的文本文件的内容我正在为 Yosemite 编写 Mac 应用程序我需要使用 Swift 但我坚持这样做这是我的代码 let messageURL NSURL string http localhost 8
任务并行库 INotifyPropertyChanged 不抛出异常？

我有一个 wpf 项目我在绑定到文本框的属性上使用 INotifyPropertyChanged 我正在使用任务 TaskParallelLibrary 在不同的线程上更新此值它已正确更新并且不会引发异常我认为它会抛出异常因为它是在
Angular 4 - Http 请求错误：您在需要流的地方提供了“未定义”

在尝试执行 HTTP Post 请求时我收到以下错误 auth service ts c694 156 请求新的时出错密码错误消息您在流所在位置提供了未定义预期的您可以提供 Observable Promise Array 或
如何使用uiwebview显示一些网页？

如何使用 uiwebview 显示某个 url 请求的网页我不知道该怎么做谁能告诉我该怎么做有开源的吗谢谢 NSString urlAddress http www google com NSURL url NSURL URLWit
如何更加重视机器学习中的某些特征？

如果使用像 scikit learn 这样的库如何为 SVM 这样的分类器的输入中的某些特征分配更多权重这是人们做还是不做的事首先你可能不应该这样做机器学习的整个概念是使用统计分析分配最佳权重你在这里干扰了整个概念因此你需要非
将列表传递给 Tcl 过程

将列表传递给 Tcl 过程的规范方法是什么如果我能得到它以便列表自动扩展为可变数量的参数我真的很喜欢它所以像这样 set a b c myprocedure option1 option2 a and myprocedure opt
在 IE 和 Chrome 中上传之前预览图像

我正在尝试设计一个模块在用户将图像上传到数据库之前我想在其中向用户显示图像的预览我找到了一个适用于 Firefox 但不适用于 IE 和 Chrome 的解决方案有人可以帮助我吗这是我的代码 function imageURL i
这个空白隐藏在哪里？

我有一个字符向量它是一些 PDF 抓取的文件pdftotext 命令行工具一切都幸福地排列得很好然而该向量充满了一种空白类型无法使用正则表达式 gt test 1 Address Clinic Information Stor
whereis python 和 python --version 之间的矛盾

在一个 Python 环境中我输入whereis python 并得到以下信息 python usr bin python2 6 usr bin python2 6 config usr bin python usr lib python
如何通知用户NPM包版本更新？

我用 Node JS 编写了一个 CLI 工具并发布到NPM https www npmjs com package rapid react 每次在终端中运行时我都需要通知用户可用的新版本及其类型补丁次要主要以便他她可以相应地更
如何计算时间复杂度为 O(n log n) 的 XOR（二元）卷积

是按位异或运算我认为Karatsuba算法可能可以解决该问题但是当我尝试在Karatsuba算法中使用XOR代替时很难得到子问题 The 卷积定理 https en wikipedia org wiki Convolution th
为什么在 Python 中处理已排序数组并不比处理未排序数组快？

在这篇文章中为什么处理排序数组比处理随机数组更快 https stackoverflow com questions 11227809 why is processing a sorted array faster than an unso

为什么在 Python 中处理已排序数组并不比处理未排序数组快？

为什么在 Python 中处理已排序数组并不比处理未排序数组快？ 的相关文章

随机推荐

热门标签

为什么在 Python 中处理已排序数组并不比处理未排序数组快？的相关文章