pandas:sample函数解释

2023-05-16

目录

1、函数定义

2、作用:

3、举个栗子

4、参数解释


1、函数定义

DataFrame.sample(self: ~ FrameOrSeries, n=None, frac=None, replace=False, weights=None, random_state=None, axis=None) 

2、作用:

从所选的数据的指定 axis 上返回随机抽样结果,类似于random.sample()函数。

3、举个栗子

1、首先定义一个数据,结构如下:

import pandas as pd
# 定义一组数据
df = pd.DataFrame({'num_legs': [2, 4, 8, 0],
                   'num_wings': [2, 0, 0, 0],
                   'num_specimen_seen': [10, 2, 1, 8]},
                  index=['falcon', 'dog', 'spider', 'fish'])
print(df)

""" -----------------结果-----------------"""
        num_legs  num_wings  num_specimen_seen
falcon         2          2                 10
dog            4          0                  2
spider         8          0                  1
fish           0          0                  8

2、从Series df['num_legs']中随机提取3个元素。注意我们使用random_state(类似于random库中随机种子的作用)确保示例的可复现性。可以看出,结果是在上述数据的“num_legs”项中随机抽取三个。

extract = df['num_legs'].sample(n=3, random_state=1)
print(extract)

"""------------运行结果----------"""
fish      0
spider    8
falcon    2
Name: num_legs, dtype: int64

3、replace=True时表示有放回抽样,设置frac=0.5表示随机抽取50%的数据,默认对行数据进行操作。栗子如下。

extract2 = df.sample(frac=0.5, replace=True, random_state=1)
print(extract2)

"""-----------运行结果-----------"""
      num_legs  num_wings  num_specimen_seen
dog          4          0                  2
fish         0          0                  8

4、一个上采样的栗子。设置 frac=2。注意,当frac>1时必须设置replace=True,默认对行数据进行操作。

extract3 = df.sample(frac=2, replace=True, random_state=1)
print(extract3)

"""-----------运行结构-----------"""
        num_legs  num_wings  num_specimen_seen
dog            4          0                  2
fish           0          0                  8
falcon         2          2                 10
falcon         2          2                 10
fish           0          0                  8
dog            4          0                  2
fish           0          0                  8
dog            4          0                  2

5、使用数据中的某列的数据值作为权重的栗子。对num_availen_seen列数据进行操作,该列数据中值较大的行更容易被采样。可以看出,num_availen_seen列中的数据为[10, 2, 1, 8],则[10, 8]两列更易被抽到。抽样结果即说明了这一点。

extract4 = df.sample(n=2, weights='num_specimen_seen', random_state=1)
print(extract4)

"""------------运行结果------------"""
        num_legs  num_wings  num_specimen_seen
falcon         2          2                 10
fish           0          0                  8

4、参数解释

n :int, optional

随机抽样返回的items个数。当frac = None时不可用。

Number of items from axis to return. Cannot be used with frac. Default = 1 if frac = None.

frac float, optional

要返回的 axis items 数量的小数(比例)表示。不能与n一起使用。

Fraction of axis items to return. Cannot be used with n.

Note:If frac > 1, replacement should be set to True.

replace bool, default False

是否是有放回取样。

Allow or disallow sampling of the same row more than once.

weights str or ndarray-like, optional

默认的“None”将导致相等的概率权重。如果传递了一个序列,将与目标对象上的索引对齐。权重中未被采样对象发现的索引值将被忽略,权重中未被采样对象的索引值将被赋值为零。如果在DataFrame上调用,将在axis = 0时接受列的名称。除非权重是一个序列,否则权重必须与被采样的轴长度相同。如果权重的和不是1,它们将被规范化为和为1。weights列中缺少的值将被视为零。不允许无限值。

Default ‘None’ results in equal probability weighting. If passed a Series, will align with target object on index. Index values in weights not found in sampled object will be ignored and index values in sampled object not in weights will be assigned weights of zero. If called on a DataFrame, will accept the name of a column when axis = 0. Unless weights are a Series, weights must be same length as axis being sampled. If weights do not sum to 1, they will be normalized to sum to 1. Missing values in the weights column will be treated as zero. Infinite values not allowed.

random_state int or numpy.random.RandomState, optional

用于随机数生成器(如果是int类型的参数)或numpy RandomState对象的种子。

Seed for the random number generator (if int), or numpy RandomState object.

axis {0 or ‘index’, 1 or ‘columns’, None}, default None

采样的轴。可以是axis的编号或名称。

Axis to sample. Accepts axis number or name. Default is stat axis for given data type (0 for Series and DataFrames).

Returns Series or DataFrame

与调用数据相同类型的新对象,包含从调用数据对象中随机取样的n项。

A new object of same type as caller containing n items randomly sampled from the caller object.

参考官网: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sample.html

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

pandas:sample函数解释 的相关文章

  • 出现“应用程序发生异常,未知的软件异常(0XC06D007E)”解决方法

    win 43 R 输入cmd 回车 然后把下面这行字符复制到黑色cmd框即在命令提示符后击鼠标右键 粘贴 回车 xff0c 耐心等待 xff0c 直到屏幕滚动停止 xff08 下面是要运行的代码 xff09 xff1a for 1 in w
  • json 笔记

    JSON简介 之前一直以为JSON只是一种文件格式 xff0c 了解了才发现并不是 JSON JavaScript Object Notation JavaScript 对象表示法 JSON 是存储和交换文本信息的语法 类似 XML JSO
  • Zookeeper启动成功后拒绝连接的解决方案

    zookeeper启动成功后zkServer sh status出错 一 问题出现情形 运行zookeeperd后显示启动成功 xff1a JMX enabled by default span class token keyword Us
  • STM32实战-高级定时器带死区的互补PWM输出

    前言 xff1a 平时我们设计点击驱动电路时 xff0c 一般会采用npn和pnp三极管 xff0c 来控制电机的导通和关闭 xff0c 但是三级管内部自带电容 xff0c 断电后不会立马断掉 xff0c 会经过很小的一段时间才会放电完毕
  • ldmia和stmia的用法

    ldmia r0 r3 r10 将基址寄存器r0开始的连续8个地址单元的值分别赋给r3 r4 r5 r6 r7 r8 r9 r10 注意的是r0指定的地址每次赋一次r0会加1 ld代表load 指向下一个地址单元 stmia r1 r3 r
  • Mysql中插入语句value和values的区别

    Mysql中插入语句 xff0c 官方文档中VALUE和VALUES都是正确的 xff0c 经过实际的操作也证实了两者也都是可以使用的 本文主要对二者插入语句数量的效率稍微的进行探究 INSERT具体使用可查看 xff1a insert官方
  • 使用VSCode配置Anaconda(3.7)-python3.6(yolov3)环境

    最近因为毕设需要用到目标检测的功能 xff0c 所以在完全小白的前提下学习了下YOLOv3 xff08 Windows10 43 Keras 43 VSCode 43 Tensorflow xff09 xff0c 在使用VSCode时遇到了
  • 深度学习Ubuntu20.04+CUDA+Pytorch环境配置+无显示器远程控制(2)

    Win10远程无显示器Ubuntu20 04系统 对于深度学习 xff0c 很多同学用的也是台式的工作站 xff0c 而不是集群服务器 但是 xff01 xff01 xff01 xff01 xff01 工作站的噪声很大 xff0c 所以我们
  • github合并分支~

    合并分支只需6个点击 1 点击这里 2 点击这里会看到有更新的分支 3 可以选择需要合并的分支 xff0c 关系是把1合并到2上 4 点击进行创建合并 5 看到对勾就是没有冲突可以合并 xff0c 点击按钮合并 6 点击confirm按钮提
  • 大华SDK+JAVA+4g网络摄像头进行二次开发

    前言 监控 xff0c 相信大家都不陌生 现在的监控技术发展迅速 xff0c 国内以海康威视为首的智能视频监控提供商也层出不穷 现在 xff0c 这些提供商都已经提供了相应的SDK以及API接口 xff0c 能够很好的支撑我们进行摄像机的二
  • 运用docker到ros2工程

    此方法制作的镜像可以直接在docker容器的伪终端对ros2工程进行命令行操作 xff0c 从而运行工程 基础知识 xff1a 登陆镜像仓库 sudo docker login 退出镜像仓库 sudo docker logout 查看镜像
  • FreeRTOS

    FreeRTOS概述 FreeRTOS目录结构 主要涉及2个目录 xff1a Demo Demo目录下是工程文件 xff0c 以 34 芯片和编译器 34 组合成一个名字 比如 xff1a CORTEX STM32F103 Keil Sou
  • Octave实现一元线性回归详解及错误分析(吴恩达老师作业)

    注意事项 建议使用CLI xff0c 简洁明了 如果函数在定义期间输入错误 xff0c 而运行期间才发现的话 xff0c 通过修改函数名 xff0c 再执行新函数 代码如下 首先要cd到txt文件保存的路径下才可读取txt文件 xff0c
  • 大半夜记录一个小知识点——matlab中omitnan未定义的问题

    之前做了老师留的一个实验 如何用matlab清除实验数据中的 脏数据 xff0c 或者说是滤波器 其中有这样一组代码 xff1a a span class token operator 61 span span class token fu
  • 【机器学习小白必备】Scikit-learn(Sklearn)最常用的函数这里都帮您总结好了~速速来取!持续更新!

    Scikit learn Sklearn 常用函数详解大全 在这篇文章中 xff0c 总结了sklearn模块常用的函数 xff0c 建议收藏 xff01 因为会持续更新 xff01 文章目录 Scikit learn Sklearn 常用
  • 【总结好文】【新手避坑指南】Ubuntu18.04 轻松愉快的安装ROS并带你仿真个无人机飞行

    Ubuntu18 04 ROS无人机PX4仿真环境搭建 引用文章 环境搭建总流程 indoor1 launch is neither a launch file 的解决办法 xff08 在最后 xff09 Gazebo模型大全下载方式无人机
  • Linux下CMake链接googletest【CMake编写】

    源码下载 git clone https github com google benchmark git git clone https github com google googletest git benchmark googlete
  • Google Colab的详细使用教程—YOLOv3为例

    一 先哔哔几句热下身 相信疫情隔离在家而且还要使用深度学习的小伙伴们或多或少都会面临么的钱买高性能显卡又么的钱租服务器的窘境 下面我就来给小伙伴们介绍以下如何使用Google Colab免费服务器的故事吧 xff08 至于怎么上Google
  • 【一文足以系列】ORB SLAM2完整详细算法流程

    目录 算法目的算法应用场景算法优点相关概念点内涵算法算法实现tracking线程步骤单目相机初始化成功条件单目相机初始化器初始化后续 初始位姿估计跟踪局部地图关键帧的创建参考关键帧 局部建图线程构建地图步骤好的地图点标准创建新地图点地图点融
  • IMU数学模型推导

    旋转运动学 质量块在body坐标系下的坐标为 xff1a body坐标系为imu坐标系 惯性系为世界坐标系 只考虑旋转 旋转到惯性系下 xff1a 对时间求导 如下 xff1a 其中 对 R R R 的求导 有如下推导 xff1a 其中

随机推荐

  • 【IMU】【卡尔曼滤波】惯性导航误差微分方程与状态转移方程

    惯性导航误差微分方程 在IMU惯性导航误差分析建模中 一共有三个微分方程 分别对应姿态误差微分方程 速度误差微分方程和位置误差微分方程 姿态误差微分方程 n为东北天坐标系 b为机体坐标系 这里求出二者之间的转换关系就可以求出IMU的姿态 这
  • 【IMU/VIOSLAM易混淆知识点】IMU坐标系和其他坐标系关系梳理以及SLAM中BA优化概念

    IMU测量值所在坐标系 imu测得的加速度和角度是在imu系下的 imu系和body坐标系存在一个固定的RT 也可以认为imu系就是body系 SLAM中的世界坐标系 世界坐标系有时候也被称为惯性系 这个纯是工程师自行定义的 比如说可能是第
  • 【优秀论文解读】BoW3D: Bag of Words for Real-time Loop Closing in 3D LiDAR SLAM

    论文简介 本论文新颖性在于3D激光雷达中实时闭环 且能够实时进行回环矫正 词袋模型为BoW3D 实时构建词袋 效率高 但是鲁棒性未知 词袋存储 word包含两种变量 xff1a Dim value为描述子计算得到的非零数和Dim ID为wo
  • 【原文核心对照代码】【一文足以系列】A-LOAM里程计部分简短精解

    前言 本文将通过论文对照代码的方式阐述A LOAM这一神奇算法 全文保持各个章节短小精悍的风格 本文会省去一些细节 xff0c 但是了解大部分的论文和代码实现已经足够了 点曲率计算与边缘点面点区分 论文中通过对点云点的曲率进行如下求曲率的计
  • 【ROS2】【源码展示】ROS2中Rviz2增加一个可以实现收发节点双击修改图表等功能的插件panel

    使用说明 源代码在这里 xff0c 本文基于源代码进行功能增加和修改 主要应用Qt中的一些方法 xff0c 结合ros2中rviz2对增加panel功能的一些封装 实现双击修改图表中的内容 xff0c 节点的收发 xff0c 图表根据收到的
  • 【持续更新篇】SLAM视觉特征点汇总+ORB特征点+VINS前端

    Harris角点 opencv函数 cornerHarris提取输入图像的Harris角点 检测原理 检测思想 xff1a 使用一个固定窗口在图像上进行任意方向的滑动 xff0c 对比滑动前后的窗口中的像素灰度变化程度 xff0c 如果存在
  • 在Ubuntu上安装samba服务器

    文章目录 在Ubuntu上安装samba服务器为什么要使用SambaSamba创建一个共享目录安装Samba服务器配置Samba服务器开启Samba服务器添加samba用户在window上共享Linux目录参考 在Ubuntu上安装samb
  • 51单片机点亮LED和使用定时器中断控制蜂鸣器发声

    初学51单片机第一个实验一般都是以点亮LED灯开始 xff0c 以下是使用Proteus仿真软件的实验效果 实验需要仿真仪器 xff1a 示波器 LED 电压表 蜂鸣器 AT89C51 实验电路图 xff1a 实验代码 xff1a incl
  • Python中的joblib.Parallel函数

    Joblib是一个可以将Python代码转换为并行计算模式的包 xff0c 可以大大简化我们写并行计算代码的步骤 我们可以通过操作该包内的函数来实现目标代码的并行计算 xff0c 从而提高代码运行效率 下面举一个简单的例子来说明 xff1a
  • Microsoft Mathematics(微软数学软件)

    microsoft mathematics是微软公司发布的一款功能强大 xff0c 且非常专业的数学软件 xff0c 同时也是由微软官方出品的数学公式编辑软件 xff0c 可以帮助用户更好的计算标准数学函数变量之间的数学关系 xff0c 以
  • UartAssist,串口调试助手

    UartAssist是一款功能非常强大 xff0c 且实用性极高的串口调试助手 xff0c 该软件不仅支持常用的110 115200bps波特率 xff0c 而且不论是它的端口号 校验位 数据位 停止位等各种数据 xff0c 在这里通通都可
  • ARCHPR(压缩密码暴力破解软件)

    常年是用电脑的小伙伴 xff0c 应该都有过忘记压缩包密码的情况 xff0c 那么这个时候该怎么办呢 xff1f 别慌 xff0c 不妨来试试ARCHPR吧 xff01 该软件不仅支持所有版本的ZIP PKZip WinZip RAR Wi
  • 佳佳数据恢复软件免费版

    佳佳数据恢复软件免费版是一款功能优异 xff0c 且操作简单的电脑数据恢复应用 xff0c 该软件不但是支持免费试用的 xff0c 而且还不限恢复文件个数和大小 xff0c 能够高效率的将误删除 误格式化 分区打不开 误清空回收站 磁盘丢失
  • 文件md5校验工具

    文件md5校验工具是一款方便实用 xff0c 且绿色迷你的md5码查询对比工具 xff0c 该工具有着精妙的摘要算法 xff0c 能够帮助用户进行查看任意文件的md5验证码 毕竟只有一个文件在传输过程中损坏 xff0c 亦或者内容被修改过
  • 视频转换处理软件

    视频转换处理软件是一款专业 易用 高效的视频处理工具 xff0c 软件内置了格式转换 视频剪切 视频转GIF 视频加水印 视频优化 旋转和翻转等六大功能 xff0c 并每个功能模块也都是互相独立的 xff0c 这也就是说 xff0c 用户在
  • 视频剪切软件

    视频剪切是一款功能强势 操作简单的视频剪切工具 xff0c 它不但可以帮助用户将视频中的精彩片段剪切出来 xff0c 轻松制作需要的短片视频 xff0c 而且还支持任意设置输出视频的视频属性和音频属性 xff0c 并支持MP4 rmvb a
  • 神奇电商宝贝下载软件

    神奇电商宝贝下载软件是一款专业 易用 高效的电商软件 xff0c 可帮助用户快速获取1688 天猫 淘宝 速卖通 企业叮咚等平台店铺中的主图视频 详情视频 主图图片 详情图片等所有信息 xff0c 从而轻松满足电商用户的所有需求 而且该软件
  • 布谷鸟算法

    布谷鸟算法是将布谷鸟育雏行为与Levy飞行算法相结合的一种算法 在布谷鸟算法中 xff0c 有两个算法或者说两个位置更新是关键 xff1a 第一个是布谷鸟寻找最优解时的算法 xff1a 一个是布谷鸟寻找鸟窝下蛋的寻找路径是采用早已就有的萊维
  • matlab实现虚拟力策略传感器分布

    第一次写文章 主要想记录一下编程过程中的坎 1 虚拟力策略 虚拟力法原理是 将机器人在环境中的运动视为一种机器人在虚拟的人工受力场的运动 障碍物对机器人产生斥力 目标点对机器人产生引力 引力和斥力的合力作为机器人的加速力 来控制机器人的运动
  • pandas:sample函数解释

    目录 1 函数定义 2 作用 xff1a 3 举个栗子 4 参数解释 1 函数定义 DataFrame sample self FrameOrSeries n 61 None frac 61 None replace 61 False we