python numpy 和内存效率（通过引用传递与值传递）

2024-04-09

我最近越来越多地使用 python 来代替 c/c++，因为它使我的编码时间缩短了几倍。同时，当我处理大量数据时，我的python程序运行速度开始变得比c中慢很多。我想知道这是否是由于我使用大型对象/数组效率低下所致。有没有关于 numpy/python 如何处理内存的综合指南？什么时候通过引用传递事物，什么时候通过值传递，什么时候复制事物，什么时候不复制，哪些类型是可变的，哪些不是。

python（以及大多数主流语言）中的对象作为引用传递。

例如，如果我们以 numpy 为例，通过索引现有数组创建的“新”数组只是原始数组的视图。例如：

import numpy as np

>>> vec_1 = np.array([range(10)])
>>> vec_1
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> vec_2 = vec_1[3:] # let vec_2 be vec_1 from the third element untill the end
>>> vec_2
array([3, 4, 5, 6, 7, 8, 9])
>>> vec_2[3] = 10000
array([3, 4, 5, 10000, 7, 8, 9])
>>> vec_1
array([0, 1, 2, 3, 4, 5, 10000, 7, 8, 9])

Numpy 有一个方便的方法来帮助您解决问题，称为 may_share_memory(obj1, obj2)。所以：

>>> np.may_share_memory(vec_1, vec_2)
True

请小心，因为该方法有可能返回误报（尽管我从未见过）。

在 SciPy 2013 上有一个关于 numpy 的教程（http://conference.scipy.org/scipy2013/tutorial_detail.php?id=100 http://conference.scipy.org/scipy2013/tutorial_detail.php?id=100）。最后，这家伙谈到了 numpy 如何处理内存。看它。

根据经验，默认情况下对象几乎不会作为值传递。即使是封装在另一个对象上的。另一个例子，列表进行游览：

Class SomeClass():

    def __init__(a_list):
        self.inside_list = a_list

    def get_list(self):
        return self.inside_list

>>> original_list = range(5)
>>> original_list
[0,1,2,3,4]
>>> my_object = SomeClass(original_list)
>>> output_list = my_object.get_list()
>>> output_list
[0,1,2,3,4]
>>> output_list[4] = 10000
>>> output_list
[0,1,2,3,10000]
>>> my_object.original_list
[0,1,2,3,10000]
>>> original_list
[0,1,2,3,10000]

令人毛骨悚然，是吧？使用赋值符号（“=”），或在函数末尾返回一个，您将始终创建一个指向该对象或其一部分的指针。仅当您明确这样做时才会复制对象，使用像 some_dict.copy 或 array[:] 这样的复制方法。例如：

>>> original_list = range(5)
>>> original_list
[0,1,2,3,4]
>>> my_object = SomeClass(original_list[:])
>>> output_list = my_object.get_list()
>>> output_list
[0,1,2,3,4]
>>> output_list[4] = 10000
>>> output_list
[0,1,2,3,10000]
>>> my_object.original_list
[0,1,2,3,10000]
>>> original_list
[0,1,2,3,4]

Got it?

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python numpy 和内存效率（通过引用传递与值传递）的相关文章

将 transaction.commit_manually() 升级到 Django > 1.6

我继承了为 Django 1 4 编写的应用程序的一些代码我们需要更新代码库以使用 Django 1 7 并最终更新到 1 8 作为下一个长期支持版本在一些地方它使用旧风格 transaction commit manually and
如何使用 colorchecker 在 opencv 中进行颜色校准？

我有数码相机获取的色彩检查器图像我如何使用它来使用 opencv 校准图像按照以下颜色检查器图像操作您是想问如何进行颜色校准或如何使用 OpenCV 进行校准为了进行颜色校准您可以使用校准板的最后一行灰色调以下是您应该逐步进行
TensorFlow：带有轴选项的 bincount

在 TensorFlow 中我可以使用 tf bincount 获取数组中每个元素的计数 x tf placeholder tf int32 None freq tf bincount x tf Session run freq feed
numpy python 中的“AttributeError：'matrix'对象没有属性'strftime'”错误

我有一个维度为 72000 1 的矩阵该矩阵涉及时间戳我想使用 strftime 如下所示 strftime d m y 为了得到像这样的输出 11 03 02 我有这样一个矩阵 M np matrix timestamps 我使用了
NumPy linalg.eig

我有这个烦人的问题但我还没有弄清楚我有一个矩阵我想找到特征向量所以我写 val vec np linalg eig mymatrix 然后我得到了 vec 我的问题是当我小组中的其他人对相同的矩阵 mymatrix 做同样的事情时
在Python中如何获取字典的部分视图？

是否有可能获得部分视图dict在Python中类似于pandasdf tail df head 说你有很长一段时间dict 而您只想检查某些元素开头结尾等 dict 就像是 dict head 3 To see the first 3
小部件之间的自定义信号

尝试将信号从一个 gtk EventBox 子级发送到另一个在 init HeadMode 第 75 行上出现错误类型错误未知信号名称消息发送 why usr bin env python coding utf8 import p
编辑 Jupyter Notebook 时 VS Code 中缺少“在选择中查找”

使用 Jupyter Notebook 时 VSCode 中缺少在选择中查找按钮它会减慢开发速度所以我想请问有人知道如何激活它吗第一张图显示了在 python 文件中的搜索替换第二张图显示了笔记本电脑中缺少的按钮 Python
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim
如何根据 HTTP 请求使用 Python 和 Flask 执行 shell 命令并流输出？

下列的这个帖子 https stackoverflow com questions 15092961 how to continuously display python output in a webpage 我能够tail f网页的日志
Pandas：如何将数据框插入 Clickhouse

我正在尝试将 Pandas 数据框插入 Clickhouse 这是我的代码 import pandas import sqlalchemy as sa uri clickhouse default localhost default ch
Python、subprocess、call()、check_call 和 returncode 来查找命令是否存在

我已经弄清楚如何使用 call 让我的 python 脚本运行命令 import subprocess mycommandline lumberjack sleep all night work all day subprocess cal
Python：我不明白 sum() 的完整用法

当然我明白你使用 sum 与几个数字然后它总结所有但我正在查看它的文档我发现了这一点 sum iterable start 第二个参数 start 的作用是什么这太尴尬了但我似乎无法通过谷歌找到任何示例并且对于尝试学习该语言的
在 Spyder 的变量资源管理器中查看局部变量

我是 python 新手正在使用 Spyder 的 IDE 我欣赏它的一项功能是它的变量资源管理器然而根据一些研究我发现它只显示全局变量我找到的解决方法是使用检查模块 import inspect local vars def m
Django - 提交具有同一字段多个输入的表单

预警我对 Django 以及一般的 Web 开发非常陌生我使用 Django 托管一个基于 Web 的 UI 该 UI 将从简短的调查中获取用户输入通过我用 Python 开发的一些分析来提供输入然后在 UI 中呈现这些分析的可视
以编程方式使用 Sphinx 特定指令解析 .rst 文件

我希望能够在 Python 中解析基于 sphinx 的 rst 以便进一步处理和检查就像是 import sphinx p sphinx parse path to file rst do something with p 似乎在 do
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j
python 日志记录会刷新每个日志吗？

当我使用标准模块将日志写入文件时logging 每个日志会分别刷新到磁盘吗例如下面的代码会将日志刷新 10 次吗 logging basicConfig level logging DEBUG filename debug log fo
如何使用Python保存“完整的网页”而不仅仅是基本的html

我正在使用以下代码来使用 Python 保存网页 import urllib import sys from bs4 import BeautifulSoup url http www vodafone de privat tarife r

随机推荐

对多索引 pandas 数据帧上的重复行求和

你好我在处理熊猫方面遇到了麻烦我正在尝试对多索引数据帧上的重复行进行求和我尝试过df groupby level 0 1 sum 还与df stack reset index groupby year product sum 和其他一
Typeorm .loadRelationCountAndMap 返回零

请帮忙我正在尝试执行以下 typeorm 查询 return await getRepository Company createQueryBuilder Company leftJoinAndSelect Company plants
在另一个绘图的绘图区域内添加小直方图

有没有办法在另一个图的绘图区域内添加直方图但独立于基础图的坐标系就我而言我想将直方图作为图例添加到分区统计图直方图将显示属于每个类别的区域数量但问题可以轻松应用于任何绘图例如 plot 1 10 rect 1 7 4 9 c
pandas DataFrame 中每一行的操作

我想迭代 pandas DataFrame 中的每一行并对每行中的元素执行一些操作现在我有 for row in df iterrows if row col gt 1 5 doSomething 但它告诉我元组索引必须是整数而不是
从 C# 打开 Google Chrome 的新窗口

可以开新的instance来自 C 的 Chrome By instance我的意思是一个新的单独选项卡不包含在现有的 Chrome 窗口中我尝试过以下解决方案但是both他们创造了一个new tab in an existingchr
MongoDB - 返回插入项的 id

从以下教程开始 https codeforgeek com 2015 08 restful api node mongodb https codeforgeek com 2015 08 restful api node mongodb 我有
MinGW GCC 通配符

我在 Windows 上使用 MinGW GCC 编译器如何编译目录中的所有 C 文件 I used gcc c o Output 在我输入所需的文件夹后出现此错误 gcc error c Invalid argument gcc fata
在 Julia 中迭代具有不同数量参数的不同函数

我正在尝试使用不同数量的参数对不同的函数运行循环变量是在运行时在循环内创建的我想在每次迭代时使用 eval 来使用变量 symbol 实例化一个 Struct 但是我不能这样做因为 eval 只在全局范围内有效这是有效案例的 MW
当我尝试创建新模型时，Django 错误：名称“_”未定义

我定义了这个模型 from django db import models from django db models import CharField Create your models here class City models M
从函数中的局部变量返回指针

我正在读一本叫做 Go 编程语言的书在关于指针的第二章中写了以下内容函数返回局部变量的地址是完全安全的例如在在下面的代码中由对 f 的特定调用创建的局部变量 v 即使是仍然存在调用返回后指针 p 仍将引用它 var p f
在 pytest 测试中记录日志

我想在测试函数中放置一些日志语句来检查一些状态变量我有以下代码片段 import pytest os import logging logging basicConfig level logging DEBUG mylogger logg
wcscmp - 使用此函数时出现访问冲突

基本上我试图比较 PSYSTEM PROCESS INFO spi 其 ImageName 字段使用字符串wcsmp如下 if wcscmp L Test exe spi gt ImageName Buffer 这似乎给了我一个访问冲突
在 PHP 中可以像在 Java 中一样一次分配多个变量吗？

我想一次创建 5 个数组类型的变量这可能吗在 Java 中我知道你可以但找不到任何关于 PHP 的信息我想做这样的事情 var1 var2 var3 var4 var5 array 是的你可以 a b c d array
如何在 Python 中向 Plotly 散点图添加文本标签？

我试图在 Python 中的 Plotly 散点图中的数据点旁边添加文本标签但出现错误我怎样才能做到这一点这是我的数据框 world rank university name country teaching internationa
jQuery jPlayer 在 Safari 中首次运行后无法重播

在 Firefox 3 6 13 中配置并运行 jPlayer 2 0 0 后一切运行顺利但相同的代码在 Safari 5 0 3 中无法运行我正在做的是创建 jPlayer 监听结束事件以重新启动它这是代码 document
如何从谷歌日历API获取当前事件？

我正在尝试使用 Google 日历 API 方法gapi client calendar events list https developers google com google apps calendar v3 reference e
对多个输入 onChange 事件使用单个处理程序

我有一堆输入我不想有多个处理程序例如 handleInput1 handleInput2 等等但我在生成以下对象数组时遇到困难 name 3 value 1000 name 5 value 1000 我怎样才能通过只监听一个处理程序并
Robolectric: NotFoundException: org.robolectric.shadows.ShadowAssetManager.getAndResolve 处的未知资源 0 (ShadowAssetManager.java:258)

我在测试 apdater 的 getView 时遇到错误测试代码在测试用例期间调用 View setImageResource 0 以在异常发生时设置空图像我用 Eclipse 运行了 test robolectric 2 2 2013
避免竞争条件，Django + Heroku + PostgreSQL

我正在运行一个竞赛网站您可以尝试点击 X 来赢得奖品它是用 Django 编写的并在带有 PostgreSQL 的 Heroku 上运行每次点击都会保存为 Play 模型的一个实例该模型通过查看之前的数据库中有多少个 Play 来
python numpy 和内存效率（通过引用传递与值传递）

我最近越来越多地使用 python 来代替 c c 因为它使我的编码时间缩短了几倍同时当我处理大量数据时我的python程序运行速度开始变得比c中慢很多我想知道这是否是由于我使用大型对象数组效率低下所致有没有关于 numpy p

python numpy 和内存效率（通过引用传递与值传递）

python numpy 和内存效率（通过引用传递与值传递） 的相关文章

随机推荐

热门标签

python numpy 和内存效率（通过引用传递与值传递）的相关文章