随机选择 DF 的特定值

2024-04-01

我有一个很大的 df，有 17520 行和 1000 列。 df 只有两个值 [0,0.05]。我想转到 df 的值为 0.05 的每个单元格并将其更改为随机值。随机值只能是0或0.05。

我尝试了以下代码行：

 y = np.array([0,0.05])
 df.replace(0.05,np.random.choice(y))

但是，它对值为 0.05 的所有单元格执行相同的随机选择，并且我希望为值为 0.05 的每个单元格执行不同的随机选择。我尝试了 for 循环，但是花费了太多时间，大约 20 分钟。我需要重复这个实验大约100次。
因此，我想知道是否有更有效的方法来做到这一点。

我将不胜感激你的帮助。

您可以使用而不是循环df.update() https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.update.html像这样，获得 >20 倍的加速：

df = pd.DataFrame(np.random.choice([0, 0.05], size=(4000, 1000)))
 %timeit df.update(np.random.choice([0, 0.05], size=df.shape), filter_func=lambda x: x==0.05)
#498 ms ± 19.4 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
df = pd.DataFrame(np.random.choice([0, 0.05], size=(4000, 1000)))
%timeit df.applymap(lambda x: np.random.choice([0, 0.05]) if x == 0.05 else 0)
#9.66 s ± 634 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

我注意到速度只会随着越来越大的数据帧而增加，但这里 applymap 已经花费了很长时间，因此我决定不再进一步增加数据帧大小。

怎么运行的

df = pd.DataFrame(np.random.choice([0, 0.05], size=(1000, 1000)))
print(df.tail(2))
df.update(np.random.choice([0, 0.05], size=df.shape), filter_func=lambda x: x==0.05)
print(df.tail(2))
#      0     1     2    3     4     5   ...   994   995   996   997   998  999
#998  0.00  0.05  0.05  0.0  0.05  0.05 ...   0.0  0.05  0.05  0.05  0.05  0.0
#999  0.05  0.00  0.05  0.0  0.05  0.05 ...   0.0  0.05  0.05  0.05  0.00  0.0
#
#[2 rows x 1000 columns]
#      0     1     2    3     4     5   ...   994   995   996  997   998  999
#998  0.00  0.05  0.00  0.0  0.05  0.05 ...   0.0  0.05  0.05  0.0  0.05  0.0
#999  0.05  0.00  0.05  0.0  0.05  0.00 ...   0.0  0.00  0.05  0.0  0.00  0.0
#
#[2 rows x 1000 columns]

With update，您可以更改 DataFrame 中选定的值。选择值（默认np.nan) use filter_func= lambda x: x==0.05然后创建一个与原始 DataFrame 大小相同的 DataFrame，其中随机选择[0, 0.05]。然后它从原始 DataFrame 中选择值0.05并将其替换为随机值。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

随机选择 DF 的特定值的相关文章

pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
如何迭代按值排序的 Python 字典？

我有一本字典比如 a 6 b 1 c 2 我想迭代一下by value 不是通过键换句话说 b 1 c 2 a 6 最直接的方法是什么 sorted dictionary items key lambda x x 1 对于那些讨厌 la
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
从 python 发起 SSH 隧道时出现问题

目标是在卫星服务器和集中式注册数据库之间建立 n 个 ssh 隧道我已经在我的服务器之间设置了公钥身份验证因此它们只需直接登录而无需密码提示怎么办我试过帕拉米科它看起来不错但仅仅建立一个基本的隧道就变得相当复杂尽管代码示例将受
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
奇怪的 MySQL Python mod_wsgi 无法连接到 'localhost' (49) 上的 MySQL 服务器问题

StackOverflow上也有类似的问题但我还没有发现完全相同的情况这是在使用 MySQL 的 OS X Leopard 机器上一些起始信息 MySQL Server version 5 1 30 Apache 2 2 13 Uni
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
如何为每个屏幕添加自己的 .py 和 .kv 文件？

我想为每个屏幕都有一个单独的 py 和 kv 文件应通过 main py main kv 中的 ScreenManager 选择屏幕设计应从文件 screen X kv 加载类等应从文件 screen X py 加载 Screens
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
具有自定义值的 Django 管理外键下拉列表

我有 3 个 Django 模型 class Test models Model pass class Page models Model test models ForeignKey Test class Question model M
如何读取Python字节码？

我很难理解 Python 的字节码及其dis module import dis def func x 1 dis dis func 上述代码在解释器中输入时会产生以下输出 0 LOAD CONST 1 1 3 STORE FAST 0 x
检查字典键是否有空值

我有以下字典 dict1 city name yass region zipcode phone address tehsil planet mars 我正在尝试创建一个基于 dict1 的新字典但是它不会包含带有空字符串的键它不会包
从 Twitter API 2.0 获取 user.fields 时出现问题

我想从 Twitter API 2 0 端点加载推文并尝试获取标准字段作者文本和一些扩展字段尤其是用户字段端点和参数的定义工作没有错误在生成的 json 中我只找到标准字段但没有找到所需的 user fields 用户

随机推荐

如何“插入表（col1，col2）值（从表2中选择max（id），从表3中选择id）；”？

我正在尝试使用名为 table1 table2 的查找表在 table1 中的 max id 与 table2 中的所有 id 之间创建多对多关系最终 table1 table2 中的行将是 table1 id table2 id 30
如何在 Flutter 中将列和行项目居中？

我有一个小货币桌我没有使用网格我使用了列和行问题是行中的项目没有显示在中心如下面的 Excel 示例所示我必须使用什么小部件才能使项目居中示例代码 return new Center child new Column cross
如何为 grails 2.4.4 配置 javamelody？得到“坏工件坐标”！

根据 grails javamelody 插件我添加了依赖项编译 grails melody 1 54 0 但我收到错误加载 BuildConfig 时出错错误工件坐标 grails melody 1 54 0 预期格式为使用 s
secTaskDiagnoseEntitlements 缺少钥匙串权利：未找到存储的 taskRef

在两个应用程序中WatchKit应用程序扩展我收到以下内容error启动时在设备日志中出现十多次 secTaskDiagnoseEntitlements MISSING keychain entitlements no stored ta
使用 Clang 进行动态检测

我试图通过使用 C 也可能是 C 进行一些动态代码检测来加快使用 Clang 的速度其中我获取源文件并生成检测后的输出我想在任何块的开头添加一个函数调用并更改所有布尔表达式以调用某个函数以便我也可以跟踪它例如 foo a b c
将 JSON 序列化器添加到每个模型类中？

当谈到 Dart 中的 JSON 编码时塞斯拉德的声明 https plus google com dartlang posts Ru4ngLqXCaE现在最终批准的正式途径是dart convert JSON Encode 假设我们有
SOLR 不搜索某些字段

刚刚安装Solr 编辑了schema xml 现在正在尝试对其进行索引并使用一些测试数据进行搜索在我发送到 Solr 的 XML 文件中我的字段之一如下所示
gitlab错误：没有这样的文件或目录，什么问题

bash home git gitlab apps gitlab gitlab shell bin gitlab shell No such file or directory what is the problem 当我克隆 gitlab
在元素之间发送图像

我正在向我的PhotoPreviewScreen一旦照片在我这里拍摄camera通过此按钮页面 onPressed async var result await controller takePicture Navigator push c
String.intern() 是否更改原始字符串 JDK7 的引用[重复]

这个问题在这里已经有答案了可能的重复 intern 在 Java 6 和 Java 7 中的行为不同 https stackoverflow com questions 7065337 intern behaving differentl
Spring Batch 集成 Java DSL 和 RunIdIncrementer 不递增

我有一个 spring boot integration batch 它将在 SFTP 上运行和轮询文件我希望能够最终使用相同的参数基本上相同的文件重新启动作业可能是因为应用程序已重新启动或者因为某些原因我们再次收到相同的文件 R
登录失败后在登录页面显示错误消息

这是来自 login jsp 的部分代码登录 jsp h2 class swd postheader Login h2
pandas - 具有非数字值的数据透视表？（数据错误：没有要聚合的数字类型）

我正在尝试对包含字符串作为结果的表进行数据透视 import pandas as pd df1 pd DataFrame index range 8 variable1 A A B B A B B A variable2 a b a b a
如何使用 python 运行带参数的 exe 文件

假设我有一个文件RegressionSystem exe 我想用一个执行这个可执行文件 config争论命令行应该是这样的 RegressionSystem exe config filename 我尝试过 regression exe
NSInvocation nil 参数

我如何或者我什至可以将 nil 参数传递给 NSInvocable 对象我尝试这样做 NSMethodSignature signature AClass instanceMethodSignatureForSelector sele
SharePoint 2007：如何在事务中执行一系列操作？

我很想知道如何在事务中的 SharePoint 上下文中执行一系列操作例如我希望能够执行以下操作 context BeginTransaction listItemA Update listItemB Update context Co
c# 从另一个类访问 WinForm 控件属性

如何访问 WinForm 控件例如ProgressBar来自另一个类的属性请参阅下面我的代码我知道这可能不是将 WinForm 类及其成员公开为的最佳选择public但我现在正试图澄清这个概念 namespace WindowsFor
如何在 Erlang 中将 XML 转换为元组列表？

我正在尝试从 XML 创建键值对元组我想从任何嵌套的 XML 中列出一个列表这似乎是一件很常见的事情但我找不到任何例子例如
android 的 SQLiteDatabase 的单个实例可以管理多个线程之间的同步吗？

我需要从不同的 AsyncTask 线程写入数据库但问题是我们需要确保一次只有一个线程正在写入数据库我的问题是如果我使用单例模式在整个应用程序中创建 SQLiteDatabase 对象的单个实例该单个实例是否会管理不同线程之间的同步
随机选择 DF 的特定值

我有一个很大的 df 有 17520 行和 1000 列 df 只有两个值 0 0 05 我想转到 df 的值为 0 05 的每个单元格并将其更改为随机值随机值只能是0或0 05 我尝试了以下代码行 y np array 0 0 05 d

随机选择 DF 的特定值

怎么运行的

随机选择 DF 的特定值 的相关文章

随机推荐

热门标签

随机选择 DF 的特定值的相关文章