Python 是将函数参数加载到寄存器中还是将它们保留在堆栈中？

2024-01-02

所以我正在编写一个函数，它接受一个元组作为参数并对其执行一系列操作。看起来是这样的：

   def swap(self, location):
    if (location[0] < 0 or location[1] < 0 or
        location[0] >= self.r or location[1] >= self.c):
        return False

    self.board[0][0] = self.board[location[0]][location[1]]
    self.board[location[0]][location[1]] = 0
    self.empty = (location[0],location[1])

我试图使我的代码尽可能高效，所以因为我没有修改location，将变量加载到寄存器中是否有意义（loc0 = location[0]; loc1 = location[1]）用于更快的计算（零周期读取）或者是location当它作为函数参数传入时，已经被Python编译器加载到寄存器中了吗？

Edit:我硬着头皮进行了一些测试。以下是此函数使用重复输入运行 1000 万次的结果（以秒为单位）："up", "down", "left", "right"（分别）

 Code as is:
   run#1: 19.39
   run#2: 17.18
   run#3: 16.85
   run#4: 16.90
   run#5: 16.74
   run#6: 16.76
   run#7: 16.94

 Code after defining location[0] and location[1] in the beginning of the function:
   run#1: 14.83
   run#2: 14.79
   run#3: 14.88
   run#4: 15.033
   run#5: 14.77
   run#6: 14.94
   run#7: 14.67

这意味着性能平均提高了 16%。对于我的情况来说绝对不是微不足道的。当然，这并不科学，因为我需要在更多环境中使用更多输入进行更多测试，但对于我的简单用例来说已经足够了！

使用 Python 2.7 在Macbook Pro（2015 年初） https://everymac.com/systems/apple/macbook_pro/specs/macbook-pro-core-i5-2.7-13-early-2015-retina-display-specs.html，其中有一个Broadwell i5-5257U CPU https://ark.intel.com/products/84985/Intel-Core-i5-5257U-Processor-3M-Cache-up-to-3_10-GHz（2c4t 最大睿频 3.1GHz，持续 2.7GHz，3MB 三级缓存）。

IDE 是：PyCharm Edu 3.5.1 JRE：1.8.0_112-release-408-b6 x86_64 JVM：OpenJDK 64 位服务器 VM 。

不幸的是，这是一个根据代码速度评分的课程。

如果您使用解释器，任何 Python 变量不太可能存在于不同表达式之间的寄存器中。您可以查看 Python 源代码如何编译为字节码。

Python 字节码（存储在解释器外部文件中的类型）是基于堆栈的（http://security.coverity.com/blog/2014/Nov/understanding-python-bytecode.html http://security.coverity.com/blog/2014/Nov/understanding-python-bytecode.html）。然后，该字节码被解释或 JIT 编译为本机机器代码。常规 python 仅进行解释，因此将 python 变量跨多个语句保存在机器寄存器中是不合理的.

用 C 编写的解释器可能会将字节码堆栈的顶部保留在解释循环内的局部变量中，而 C 编译器可能会将该 C 变量保留在寄存器中。因此，重复使用相同的 Python 变量可能最终不会有太多的存储/重新加载往返。

请注意，Broadwell CPU 上的存储转发延迟约为 4 或 5 个时钟周期，远低于 DRAM 往返的数百个周期。存储/重新加载甚至不必等待存储退出并提交到 L1D 缓存；它直接从存储缓冲区转发。有关的：http://blog.stuffedcow.net/2014/01/x86-memory-disambiguation/ http://blog.stuffedcow.net/2014/01/x86-memory-disambiguation/ and http://agner.org/optimize/ http://agner.org/optimize/，以及其他链接x86 /questions/tagged/x86标签维基）。对于 L1D 缓存命中，加载使用延迟也只有 5 个时钟周期（从地址准备好到数据准备好的延迟。您可以通过链表（在 asm 中）进行指针追踪来测量它。）有足够的解释器开销（总计它运行以确定下一步要做什么的指令数量），这甚至可能不是瓶颈。

对于解释器来说，将特定的 python 变量保存在寄存器中根本不合理。即使你用 asm 写了一个解释器，根本问题是寄存器不可寻址。 x86add r14d, eax指令必须将两个寄存器硬编码到指令的机器代码中。（所有其他 ISA 的工作方式都相同：寄存器号是指令机器代码的一部分，没有基于任何数据的间接寻址）。即使解释器做了工作来弄清楚它需要“将 reg-var #3 添加到 reg-var #2”（即将字节码堆栈操作解码回寄存器变量以获得它解释的内部表示），它也会必须使用与任何其他寄存器组合不同的功能。

给定一个整数，获取第 N 个寄存器的值的唯一方法是分支到使用该寄存器的指令，或者将所有寄存器存储到内存并索引结果数组。（或者可能是某种无分支比较和掩码的东西）。

无论如何，尝试对此做任何具体的事情都是无利可图的，这就是为什么人们只用 C 编写解释器并让 C 编译器（希望）很好地优化实际运行的机器代码。

或者您编写一个 JIT 编译器，就像 Sun 为 Java 所做的那样（HotSpot VM）。 IDK 如果有 Python 的话。看Python 3 解释器有 JIT 功能吗？ https://stackoverflow.com/questions/13034991/does-the-python-3-interpreter-have-a-jit-feature.

JIT 编译器实际上会将 Python 代码转换为机器代码，其中寄存器状态主要保存 Python 变量而不是解释器数据。同样，如果没有 JIT 编译器（或提前编译器），“将变量保存在寄存器中”就不是一回事。

它可能更快，因为它避免了 [] 运算符和其他开销（参见布伦的回答，您接受了）

脚注：一些 ISA 具有内存映射寄存器。例如AVR（8 位 RISC 微控制器），该芯片还具有内置 SRAM，其中包含低范围内存地址（包括寄存器）。因此，您可以执行索引加载并获取寄存器内容，但您也可能在未保存架构寄存器内容的内存上执行此操作。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 是将函数参数加载到寄存器中还是将它们保留在堆栈中？的相关文章

如何将本机 popcount 与 numba 一起使用

我正在使用 numba 0 57 1 我想在我的代码中利用本机 CPU popcount 我现有的代码太慢因为我需要运行它数亿次这是一个 MWE import numba as nb nb njit nb uint64 nb uint6
使用 Python 在 Google Cloud Storage 存储桶中创建/上传新文件

如何使用 Python 和可用的客户端库在 Google Cloud Storage 中创建新的空文件或者如何使用 blob 函数 upload from filename 将新文件上传到选定的存储桶要初始化 blob 对象我们应该在
pip 安装失败，SSL 证书验证失败 (_ssl.c:833)

我无法通过 pip install 安装任何外部 python 模块我已经正确安装了 python 但如果我使用 pip install 它会显示此错误这是我运行后的代码pip install pytesseract C Users 1
Python grpc protobuf 存根生成问题：--grpc_out: protoc-gen-grpc: 插件失败，状态代码 1

正如问题所说我从源代码编译了 grpc 并且也做了sudo pip install grpcio 但是那which grpc python plugin不返回任何内容这是一个问题因为route guide的grpc python示例
Spyder 导入模块出错

我正在尝试在 Spyder 中使用 sklearn 一开始当我尝试导入它时我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的更新模
如何从 Lua 调用 Python 函数？

我想从我的 lua 文件运行 python 脚本我怎样才能实现这个目标 Example Python代码 sum py file def sum from python a b return a b Lua code main lua f
OpenCV - 我需要将彩色图像插入黑白图像并且

我用以下代码将黑白图像插入彩色图像没问题 face grey cv cvtColor face cv COLOR RGB2GRAY for row in range 0 face grey shape 0 for column in ra
了解 asyncio 已经运行的永久循环和挂起的任务

我在理解如何将新任务挂起到已经运行的事件循环中时遇到问题这段代码 import asyncio import logging asyncio coroutine def blocking cmd while True logging in
如何为 C 分配的 numpy 数组注册析构函数？

我想在 C C 中为 numpy 数组分配数字并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
是否有更矢量化的方法来沿轴执行 numpy.outer ？

gt gt gt x np array a0 a1 b0 b1 gt gt gt y np array x0 x1 y0 y1 gt gt gt iterable np outer x i y i for i in xrange x sha
使用 3d 对象作为 3d 散点图中的标记 - Python

使用下面的代码我尝试模拟一个用罐头制成的碗我希望每个标记都是一个罐头最好的方法是什么我真的很感激任何建议谢谢 import pylab import numpy as np from math import pi sin cos
使 np.loadtxt 使用多个可能的分隔符

我有一个程序可以读取数据文件用户可以选择他们想要使用的列我希望它对于输入文件更加通用有时列可能如下所示 10 34 24 58 8 284 6 121 有时它们可能看起来像这样 10 34 24 58 8 284 6 121 我希
检查多个 pd.DataFrame 是否相等

是否有一种 Pythonic 方式无循环或递归来检查是否超过两个pd DataFrames 例如 pd DataFrames 列表彼此相等吗就像是 all x equals dfs 0 for x in dfs with dfs数据
使用 Python 脚本打开特定文件类型？

如何使 Python 脚本成为特定文件类型例如 foo 的默认应用程序例如当我双击 Finder Explorer 中的文件时我希望该文件在 Python 脚本中打开这可以在 Win 和或 OS X 中实现吗如果重要的话该应
ESP 和 EBP 寄存器是什么？

我发现ESP寄存器是当前堆栈指针 EBP是当前堆栈帧的基指针但是我不理解这些定义我刚刚开始学习如何在汇编程序中编码 What I understand is that ESP points towards the stack itse
如何将 fields 参数传递到 Google Drive Python API 调用中

I have results drive service files list body execute where body q query string maxResults 1 为了提高性能我想限制返回的字段如下所述 https
Flask 扩展未在 app.extensions 中注册

我想访问在我的 Flask 应用程序上注册的一些扩展我尝试使用app extensions 但我初始化的一些扩展不在字典中 from flask import current app current app extensions get
如何配置 Eclipse 在使用 Pydev 插件选择“运行”或“调试”时启动浏览器

我正在使用 Eclipse Pydev 插件学习 Python 和 Django 当我按运行或调试时我希望内部或外部浏览器使用 URL http 127 0 0 1 启动或刷新我见过用 PHP 插件完成的但没有用 Pydev
在至少 7 天内连续三天登录该产品的用户

我有一个用于用户参与的数据框 df 如下所示 time stamp user id 2013 01 01 10 05 23 1 2013 01 03 16 35 23 1 2013 01 06 11 06 35 1 2013 01 10 1
部署 Flask 应用程序时如何检测额外文件的更改并重新加载应用程序？ [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我在 Flask 中构建了一个小型 Web 应用程序并尝试将其部署在 Pythonanywhere 上在开发过程中

随机推荐

如何授予apache写入主目录的权限？

我的服务器位于 var www html 我在 var www html fileio test io test php 有一个 php 脚本当我尝试运行这个脚本时我得到 Warning fopen home djameson test
Spring Security 配置自动装配自定义 UserDetailsService bean

我最近回到了我一直在从事的一个 Spring 项目在启动应用程序时遇到了问题这个问题可能是重复的但我一直找不到答案这是我原来的 SecurityConfig java 的一个片段 Configuration EnableWebSec
如何使用Java找到矩阵的鞍点？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案如何使用Java找到矩阵的鞍点该鞍点是行中最大的数字同时也是列中最大的数字例如使用这个矩阵 7 2 1 3 5 8 鞍点是 7 和
Access - 根据不同的列值获取不同的行数

我有一个具有以下格式的访问数据库 ID Period Data 13 1 xxxxx 13 2 xxxxx 25 1 xxxxx 25 2 xxxxx 25 3 xxxxx 52 1 xxxxx 52 3 xxxxx 94 1 xxxxx
CUDA 阻塞标志

创建 CUDA 事件时您可以选择打开cudaEventBlockingSync旗帜但是如果创建带有或不带有标志的事件之间存在差异怎么办我阅读精美的手册 http developer download nvidia com compu
将显示名称作为值的 Get-ADUser

我在 CSV 文件中有用户显示名称列表我试图获取 samAccountName 并将其导出到 CSV 文件但它不起作用我知道 get aduser 不接受显示名称作为值所以我使用了过滤器但仍然没有请工作帮助 CSV 文件格式 Us
python: sqlalchemy - 如何使用新的事件系统确保连接不会过时

我正在 python 中使用 sqlalchemy 包在现有表上执行自动加载后我有一个操作需要一些时间才能执行当我尝试使用连接时这会导致以下错误 sqlalchemy exc OperationalError Operational
Android：闹钟完成或关闭时打开活动

用户通过手机库存时钟设置的每个闹钟都可以选择在闹钟解除或完成时打开另一个应用程序我不确定 Marshmallow 中是否添加了此功能但我有它并且运行 android M 每个警报的默认设置为无但您可以选择邮件天气音乐应用程序等
MyBatis 中单个映射器方法中的多个语句

我有一个映射器方法来删除表中的所有记录但首先我需要删除关联连接表中的所有记录这是我尝试过的 Delete delete from COC BLOCK FIELD delete from COC BLOCK void deleteBloc
jQuery UI 自动完成刷新数据

我使用 jQuery ui 自动完成功能 var colors document ready function loadColors empf autocomplete colors function loadColors colors n
如何使用 Django Rest Framework 反序列化嵌套对象

假设我有这样的 Django 模型 class Book models Model title models CharField max length 150 author models CharField max length 150 c
AngularJS：基于 Google Maps API 的单元测试应用程序

我需要为 AngularJS 应用程序编写单元测试该应用程序大量使用 Google Maps API v3 计算距离在地图中创建标记等并且我知道我应该以某种方式创建或模拟地图画布以便我可以对使用 Google Maps 的功能进行单
Emacs 抱怨函数无效？

当我按下C c c在缓冲区中使用以下代码 Emacs 会抱怨Invalid function select current line Why defun select current line Select the current line
如何将参数从 docker-compose 传递到 docker 镜像中运行的服务？

My docker compose yml 除其他图像外使用官方 mongo docker 镜像 https github com docker library mongo blob master 3 2 Dockerfile mongo
如何防止引导模式使用 onclick 从按钮关闭？

我有带按钮的模态保存
如何将 django-mptt 重建添加到迁移中？

我已将 django mptt 添加到现有数据库并创建新的迁移迁移过程被要求提供默认值level left right和这样的字段但不添加model rebuild对迁移文件的操作如何手动向迁移文件添加重建操作请尝试以下操作 fr
向箱线图添加颜色 - “连续值提供给离散比例”错误

我的问题可能有一个非常简单的解决方案但我在网上找不到令人满意的答案使用以下命令我能够创建以下箱线图并将其与各个数据点覆盖 ggplot data MYdata aes x Age y Richness geom boxplot aes
SQL Server 中的 Case 语句用于识别可能的重复项

我有一个包含一些记录的临时表 CREATE TABLE TEMP PER ID INT PER SS VARCHAR 11 PER MISC VARCHAR 25 PER CLASS VARCHAR 20 FILE DT DATETIME
Azure Functions - 如何从函数内获取调用 ID？

我试图返回 Azure 函数的调用 ID 类似于 WebJob 在 HTTP Location 标头中发送回 WebJob 运行 ID 这样我的函数的调用者就可以定期检查状态以了解它何时完成我发现我必须将此 id 添加到响应对象中并且我
Python 是将函数参数加载到寄存器中还是将它们保留在堆栈中？

所以我正在编写一个函数它接受一个元组作为参数并对其执行一系列操作看起来是这样的 def swap self location if location 0 lt 0 or location 1 lt 0 or location 0 gt

Python 是将函数参数加载到寄存器中还是将它们保留在堆栈中？

Python 是将函数参数加载到寄存器中还是将它们保留在堆栈中？ 的相关文章

随机推荐

热门标签

Python 是将函数参数加载到寄存器中还是将它们保留在堆栈中？的相关文章