如何通过从另一个数据框中随机选择来创建数据框？

2023-12-09

DP 1      DP 2    DP 3     DP 4     DP 5     DP 6     DP 7     DP 8    DP 9    DP 10
(0.519)  (1.117)  (1.152)   0.772       1.490    (0.850)  (1.189)  (0.759)      
0.030    0.047     0.632   (0.608)     (0.322)   0.939     0.346    0.651       
1.290    (0.179)   0.006    0.850      (1.141)   0.758     0.682            
1.500    (1.228)   1.840   (1.594)     (0.282)   (0.907)                
(1.540)  0.689    (0.683)   0.005   0.543                   
(0.197)  (0.664)  (0.636)   0.878                       
(0.942)  0.764    (0.137)                           
0.693    1.647                              
0.197

我有上面的数据框：

我需要使用上面数据帧中的随机值来使用下面的数据帧：

 DP 1       DP 2      DP 3    DP 4         DP 5     DP 6      DP 7     DP 8        DP 9   DP 10
     (0.664)    1.290    0.682    0.030      (0.683)  (0.636)    (0.683)   1.840     (1.540)    
     1.490     (0.907)   (0.850) (0.197)     (1.228)   0.682     1.290     0.939        
     0.047      0.682    0.346    0.689      (0.137)   1.490     0.197          
     0.047      0.878    0.651    0.047      0.047    (0.197)               
     (1.141)    0.758    0.878    1.490      0.651                  
     1.647      1.490    0.772    1.490                         
     (0.519)    0.693    0.346                          
     (0.137)    0.850                               
     0.197

我试过这段代码：

df2= df1.sample(len(df1))

打印（df2）

但输出是

     DP1       DP2       DP3       DP4       DP5       DP6       DP7       DP8  DP9
    OP8   0.735590  1.762630       NaN       NaN       NaN       NaN       NaN       NaN  NaN
    OP7  -0.999665  0.817949 -0.147698       NaN       NaN       NaN       NaN       NaN  NaN
    OP2   0.031430  0.049994  0.682040 -0.667445 -0.360034  1.089516  0.426642  0.916619  NaN
    OP3   1.368955 -0.191781  0.006623  0.932736 -1.277548  0.880056  0.841018       NaN  NaN
    OP1  -0.551065 -1.195305 -1.243199  0.847178  1.668630 -0.986300 -1.465904 -1.069986  NaN
    OP4   1.592201 -1.314628  1.985683 -1.749389 -0.315828 -1.052629       NaN       NaN  NaN
    OP6  -0.208647 -0.710424 -0.686654  0.963221       NaN       NaN       NaN       NaN  NaN
    OP10       NaN       NaN       NaN       NaN       NaN       NaN       NaN       NaN  NaN
    OP9   0.209244       NaN       NaN       NaN       NaN       NaN       NaN       NaN  NaN
    OP5  -1.635306  0.737937 -0.736907  0.005545  0.607974       NaN       NaN       NaN  NaN

您可以使用np.random.choice()用于采样。

假设df是这样的：

df = pd.DataFrame({'DP 1': ['(0.519)','0.030','1.290','1.500','(1.540)','(0.197)','(0.942)','0.693','0.197'],'DP 2': ['(1.117)','0.047','(0.179)','(1.228)','0.689','(0.664)','0.764','1.647',np.nan],'DP 3': ['(1.152)','0.632','0.006','1.840','(0.683)','(0.636)','(0.137)',np.nan,np.nan],'DP 4': ['0.772','(0.608)','0.850','(1.594)','0.005','0.878',np.nan,np.nan,np.nan],'DP 5': ['1.490','(0.322)','(1.141)','(0.282)','0.543',np.nan,np.nan,np.nan,np.nan],'DP 6': ['(0.850)','0.939','0.758','(0.907)',np.nan,np.nan,np.nan,np.nan,np.nan],'DP 7': ['(1.189)','0.346','0.682',np.nan,np.nan,np.nan,np.nan,np.nan,np.nan],'DP 8': ['(0.759)','0.651',np.nan,np.nan,np.nan,np.nan,np.nan,np.nan,np.nan],'DP 9': [np.nan,np.nan,np.nan,np.nan,np.nan,np.nan,np.nan,np.nan,np.nan],'DP 10': [np.nan,np.nan,np.nan,np.nan,np.nan,np.nan,np.nan,np.nan,np.nan]})

#       DP 1     DP 2     DP 3     DP 4     DP 5     DP 6     DP 7     DP 8     DP 9    DP 10
# 0  (0.519)  (1.117)  (1.152)    0.772    1.490  (0.850)  (1.189)  (0.759)      NaN      NaN
# 1    0.030    0.047    0.632  (0.608)  (0.322)    0.939    0.346    0.651      NaN      NaN
# 2    1.290  (0.179)    0.006    0.850  (1.141)    0.758    0.682      NaN      NaN      NaN
# 3    1.500  (1.228)    1.840  (1.594)  (0.282)  (0.907)      NaN      NaN      NaN      NaN
# 4  (1.540)    0.689  (0.683)    0.005    0.543      NaN      NaN      NaN      NaN      NaN
# 5  (0.197)  (0.664)  (0.636)    0.878      NaN      NaN      NaN      NaN      NaN      NaN
# 6  (0.942)    0.764  (0.137)      NaN      NaN      NaN      NaN      NaN      NaN      NaN
# 7    0.693    1.647      NaN      NaN      NaN      NaN      NaN      NaN      NaN      NaN
# 8    0.197      NaN      NaN      NaN      NaN      NaN      NaN      NaN      NaN      NaN

首先提取choices从所有非空值df:

choices = df.values[~pd.isnull(df.values)]

# array(['(0.519)', '(1.117)', '(1.152)', '0.772', '1.490', '(0.850)',
#        '(1.189)', '(0.759)', '0.030', '0.047', '0.632', '(0.608)',
#        '(0.322)', '0.939', '0.346', '0.651', '1.290', '(0.179)', '0.006',
#        '0.850', '(1.141)', '0.758', '0.682', '1.500', '(1.228)', '1.840',
#        '(1.594)', '(0.282)', '(0.907)', '(1.540)', '0.689', '(0.683)',
#        '0.005', '0.543', '(0.197)', '(0.664)', '(0.636)', '0.878',
#        '(0.942)', '0.764', '(0.137)', '0.693', '1.647', '0.197'],
#       dtype=object)

然后采取np.random.choice() from choices对于所有非空单元格：

df = df.applymap(lambda x: np.random.choice(choices) if not pd.isnull(x) else x)

#       DP 1     DP 2     DP 3     DP 4     DP 5     DP 6     DP 7     DP 8     DP 9    DP 10
# 0  (0.179)    0.682    0.758  (1.152)  (0.137)  (1.152)    0.939  (0.759)      NaN      NaN
# 1    1.500  (1.152)  (0.197)    0.772    1.840    1.840    0.772  (0.850)      NaN      NaN
# 2    0.878    0.005  (1.540)    0.764  (0.519)    0.682  (1.152)      NaN      NaN      NaN
# 3    0.758  (0.137)    1.840    1.647    1.647  (0.942)      NaN      NaN      NaN      NaN
# 4    0.693  (0.683)  (0.759)    1.500  (0.197)      NaN      NaN      NaN      NaN      NaN
# 5    0.006  (0.137)    0.764  (1.117)      NaN      NaN      NaN      NaN      NaN      NaN
# 6  (0.664)    0.632  (1.141)      NaN      NaN      NaN      NaN      NaN      NaN      NaN
# 7    0.543  (0.664)      NaN      NaN      NaN      NaN      NaN      NaN      NaN      NaN
# 8  (0.137)      NaN      NaN      NaN      NaN      NaN      NaN      NaN      NaN      NaN

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

DataFrame

Triangle

如何通过从另一个数据框中随机选择来创建数据框？的相关文章

函数名称未定义

我有一段代码看起来像这样 if name main main def main print hello 但是当我尝试运行此代码时出现错误 NameError 名称 main 未定义我是否没有在函数 def main 的第一行定义名称
使用ideone时如何传入命令行参数？

我正在使用 ideone 在线解释器 http ideone com http ideone com 来测试一些 C 和 Python 程序如何指定命令行参数而不是使用 STDIN 输入看起来你不能但是快速破解应该做的伎俩 stati
创建 xyz 海拔数据的曲面图

我正在尝试用 python 创建一座山的表面图其中我有一些 xyz 数据最终结果应该类似于that https i stack imgur com rKQV0 png 该文件的格式如下 616000 0 90500 0 3096 712
如何在Python + Selenium中获取元素的值

我在我的 Python 3 6 3 代码中得到了这个 HTML 元素作为 Selenium网页元素当然 span class ocenaCzastkowa masterTooltip style color 000000 alt 5 sp
基于列重复数据集中的行，但增加行[重复]

这个问题在这里已经有答案了我有一个数据集其中包含项目名称开始年份和合同期限我需要将这个数据集开发成时间序列例如我的数据集中的一行是项目 A 开始年份 2003 年合同期限 5 我想根据合同期限重复每一行我的数据集如下所示
Python Apache Beam 端输入断言错误

我对 Apache Beam Cloud Dataflow 还很陌生所以如果我的理解不正确我深表歉意我正在尝试通过管道读取大约 30 000 行长的数据文件我的简单管道首先从 GCS 打开 csv 从数据中提取标题通过 ParDo
提高光线追踪命中功能的性能

我有一个简单的 python 光线追踪器渲染 200x200 的图像需要 4 分钟这对于我的口味来说绝对是太多了我想改善这种情况几点我为每个像素发射多条光线以提供抗锯齿功能每个像素总共发射 16 条光线 200x200x16
Pandas 中每列的曲线拟合 + 外推值

我有一个包含大约 300 列的数据集每一列都与深度相关 Pandas DataFrame 的简化版本看起来像这样 import matplotlib pyplot as plt import numpy as np import pand
Kivy TextInput 水平和垂直对齐（文本居中）

如何在 Kivy 的 TextInput 中水平居中文本 I have the following screen But I want to centralize my text like this 这是我的 kv 语言的一部分 BoxLa
使用具有可变数量索引的 numpy mggrid

如何将 numpy mgrid 与可变数量的索引一起使用我在 github 上找不到任何人将其与硬编码值以外的任何内容一起使用的示例 import numpy as np np mgrid 1 10 1 10 this works fin
在字符串内打印单引号

我想输出 XYZ s ABC 我在Python IDLE中尝试了以下3条语句第一条和第二条语句输出 a before 带打印功能的第三条语句不输出 before 作为 Python 新手我想了解为什么之前输出在第 1 条和第 2 条
在Python中随机交错2个数组

假设我有两个数组 a 1 2 3 4 b 5 6 7 8 9 我想将这两个数组交错为变量 c 注意 a 和 b 不一定具有相同的长度但我不希望它们以确定性的方式交错简而言之仅仅压缩这两个数组是不够的我不想要 c 1 5 2 6 3
在 4K 屏幕上使用 Matplotlib 和 TKAgg 或 Qt5Agg 后端

我在 Ubuntu 16 04 上使用 Matplotlib 2 0 和 Python 3 6 来创建数据图电脑显示器的分辨率为 4k 分辨率为 3840x2160 绘图数字看起来非常小字体也很小我已经尝试过TKAgg and Qt5
为什么我会在 Python 字符串格式中使用除 %r 之外的其他内容？

我偶尔会使用 Python 字符串格式这可以像这样完成 print int i Float f String s 54 34 434 some text 但是这也可以这样做 print int r Float r String r 54
本地主机上的 Google App Engine GQL 查询

我正在 Google App Engine Windows 上的 SDK 版本 1 7 0 上开发一个应用程序我需要经常测试该应用程序并且此测试涉及数据存储上的大量 GQL 查询您可以在 App Engine 管理界面的浏览器中在线运
如何使用 python 模块的多个 git 分支？

我想使用 git 来同时处理我正在编写的模块中的多个功能我目前正在使用 SVN 只有一个工作区因此我的 PYTHONPATH 上只有该工作区我意识到这不太理想所以我想知道是否有人可以建议一种更正确的方法来做到这一点让我用一个假
为数据集生成随机 JSON 结构排列

我想生成 JSON 结构的许多不同排列作为同一数据集的表示最好不需要对实现进行硬编码例如给定以下 JSON name smith occupation agent enemy humanity nemesis neo 应该产生许多不同
如何仅读取 CSV 文件每行的第一列 [重复]

这个问题在这里已经有答案了如何在Python中读取CSV文件每行的第一列我的数据是这样的 1 abc 2 bcd 3 cde 我只需要循环第一列的值另外当我在 calc 中打开 csv 文件时每行中的数据都在同一个单元格中这正常
如何在不同的目录中执行python脚本？

Solved对于可能觉得这有帮助的人请参阅下面我的答案我有两个脚本 a py 和 b py 在我当前的目录 C Users MyName Desktop MAIN 中我运行 gt python a py 第一个脚本 a py 在我当前
如何使 Django 自定义管理命令参数不再需要？

我正在尝试在 django 中编写自定义管理命令如下所示 class Command BaseCommand def add arguments self parser parser add argument delay type int

随机推荐

通过pywin32将pandas数据框写入word文档表

我目前正在编写一个脚本需要写入 docx 文件以进行演示我使用 pandas 来处理脚本中的所有数据计算我希望使用 PyWIN32 将 pandas 数据帧写入 word docx 文件中书签处的表中数据框由浮点数组成伪代码是这样
如何创建其中包含永久提示的编辑文本

我有一个编辑文本用户在其中输入金额我想要做的是在其前面设置一个用户不可编辑的文本视图值例如 INR 然后用户将在其前面输入金额我希望 edittext 看起来像下面的那样我怎样才能做到这一点
Laravel 4 Auth with Facebook（无密码身份验证）

我正在尝试使用 Laravel 4 设置一个通过 Facebook 登录的身份验证系统我正在为 Laravel 4 使用 madewithlove laravel oauth2 包当然当用户使用 Facebook 登录时没有密码可以
ElementTree(1.3.0) Python中XML解析的高效方法

我正在尝试解析一个巨大的 XML 文件 20MB 3GB 文件是来自不同仪器的样本所以我正在做的是从文件中查找必要的元素信息并将它们插入到数据库 Django 中我的文件样本的一小部分命名空间存在于所有文件中文件的有趣特征是它们有
ASP.NET MVC 5 错误处理

我们想要处理 403 错误 404 错误以及由于以下原因导致的所有错误MySpecialDomainException并为所有其他错误包括 IIS 配置中的错误提供默认错误页面所有错误都应该返回正确的 Razor 视图如果有一个Er
通量存储或操作（或两者）是否应该接触外部服务？

如果商店保持自己的状态并能够调用网络和数据存储服务在这种情况下这些操作只是愚蠢的消息传递者 OR 存储是否应该是来自操作的不可变数据的愚蠢接收者并且操作是在外部源之间获取发送数据的操作在这种情况下存储将充当视图模型并且能够聚合
循环数组并将连续数字分组到另一个数组 SWIFT 4 中的最佳方法？

我试图找出使用 SWIFT 4 循环数字数组获取任何连续数字的范围并将其添加到新数组的最有效方法我可以进行标准循环检查但我相信我可以使用地图过滤器有人能指出我正确的方向吗开始 myNumbersArray Int 1 2 3 4
如何在UIWebView中设置自定义字体？

我在资源中有一个字体并将其加载到 UIFont 中我想知道如何使用这个 UIFont 作为我的 UIWebView 的默认字体提前致谢如果您使用网页在WebView中显示这就是我要做的使用 HTML 页面的标题创建一个字符串在
查找并单击具有更改 CSS 选择器的元素 (python)

我正在编写一个脚本需要单击页面的某个元素但是 CSS 选择器每天都会随着元素更改其位置而更改今天它的名字叫 PPTAmFCTable gt tbody nth child 1 gt tr nth child 11 gt td nth
如何在parallel.for中强制执行有序执行序列？

我有一个简单的并行循环来做一些事情然后我将结果保存到文件中 object items array with all items object resultArray new object numItems Parallel For 0 n
JavaScript 中的 setTimeout 与 setInterval

您好我们可以将 setInterval 更改为 setTimeout 函数吗它工作正常我想知道它可以通过 setTimeout 完成吗
将捆绑包发送到另一个活动

我正在尝试将一个包从一项活动发送到另一项活动当我在接收活动中加载包时所有信息似乎都是空的这是一些代码活动A 发送包 public void onItemClick AdapterView
在 PHPExcel 中按列和行获取单元格作为字符串

我正在尝试将可能带有尾随零的单元格读取为字符串而不是数字它会去掉前导零单元格由整数列行读取如下所示而不是像这样的列字符串answer has 初始代码 instReader reader gt load this gt file
如何转义字符串中的双引号？

我希望双引号出现在以下字符串中因此它看起来像 hi there 这是我正在使用的代码 NSMutableString s NSMutableString alloc init s appendString s appendString h
STM32F4 通过软复位跳转到引导加载程序，无需 BOOT0 和 BOOT1 引脚

我问这个问题是因为可以在这里找到类似问题的答案通过应用程序跳转到 STM32 中的引导加载程序即从用户闪存在引导模式下使用引导 0 和引导 1 引脚用户 JF002 JF002回答当我想跳转到引导加载程序时我在其中一个备份寄存器中
PHPUnit 跳过所有测试

当我尝试运行 PHPUnit 时所有测试都会立即跳过没有错误或任何东西有人能指出我正确的方向吗 vagrant vagrant selenium phpunit PHPUnit 3 7 28 by Sebastian Bergmann
将对象列表序列化到 XDocument

我尝试使用以下代码将对象列表序列化到 XDocument 中但收到错误消息无法将非空白字符添加到内容中 public XDocument GetEngagement MyApplication application ProxyClie
自定义具有多个值的工具提示

我正在研究 angularjs 谷歌图表堆积栏我想自定义堆叠栏上显示的工具提示数据想要在鼠标悬停在堆叠栏上时显示该栏的所有堆栈信息目前仅显示当前鼠标悬停在堆栈上的信息请找到演示http plnkr co edit ahg7JiBpO
使用 iTextSharp 位于底部的 PDF 页脚

我正在尝试使用 iTextSharp 5 0 6 在 C 中创建 pdf 文档我想分别在 OnStartPage 和 OnEndPage 事件中向每个页面添加页眉和页脚对于页脚存在一个问题即页脚是在页面结束的位置创建的而我希望位于
如何通过从另一个数据框中随机选择来创建数据框？

DP 1 DP 2 DP 3 DP 4 DP 5 DP 6 DP 7 DP 8 DP 9 DP 10 0 519 1 117 1 152 0 772 1 490 0 850 1 189 0 759 0 030 0 047 0 632 0 6

如何通过从另一个数据框中随机选择来创建数据框？

如何通过从另一个数据框中随机选择来创建数据框？ 的相关文章

随机推荐

热门标签

如何通过从另一个数据框中随机选择来创建数据框？的相关文章