将列的百分比设置为 0 (pandas)

2024-04-28

我有一个 pandas 数据框，我想将列的某些百分比设置为 0。假设 df 有两列。

我现在想将 df 的前 20% 和后 20% 的 B 设置为 0。

Use numpy.r_ https://docs.scipy.org/doc/numpy/reference/generated/numpy.r_.html连接第一个和最后一个位置，然后更改值iloc http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.iloc.html，对于列的位置B use Index.get_loc http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Index.get_loc.html:

N = .2
total = len(df.index)
#convert to int for always integer
i = int(total * N)
idx = np.r_[0:i, total-i:total]
df.iloc[idx, df.columns.get_loc('B')] = 0

Or:

N = .2
total = len(df.index)
i = int(total * N)
pos = df.columns.get_loc('B')

df.iloc[:i, pos] = 0
df.iloc[total - i:, pos] = 0

EDIT:

If Sparsedataframe http://pandas.pydata.org/pandas-docs/stable/sparse.html#sparsedataframe并且相同类型的值可以转换为 numpy 数组，设置值并转换回来：

arr = df.values
N = .2
total = len(df.index)
i = int(total * N)
pos = df.columns.get_loc('B')
idx = np.r_[0:i, total-i:total]

arr[idx, pos] = 0
print (arr)
[[1 0]
 [2 7]
 [3 8]
 [4 4]
 [5 0]]

df = pd.SparseDataFrame(arr, columns=df.columns)
print (df)
   A  B
0  1  0
1  2  7
2  3  8
3  4  4
4  5  0

print (type(df))
<class 'pandas.core.sparse.frame.SparseDataFrame'>

EDIT1:

另一个解决方案是先转换为密集，然后再转换回来：

df = df.to_dense()
#apply solution
df = df.to_sparse()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将列的百分比设置为 0 (pandas) 的相关文章

如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana
将 geojson 文件下载到 jupyter 中的 folium 中

我想要一张欧洲地图作为 json 文件这样我就可以使用 geojson 将其作为图层放置在 Folium 地图上这样我就可以将我的数据集嵌入到其中以显示欧洲哪个国家的酒精含量最高我在从 GitHub 获取 json 文件以在 jy
Python 正则表达式从文本中提取域

我有以下正则表达式 r a zA Z0 9 a zA Z0 9 61 a zA Z0 9 a zA Z 2 6 当我将其应用于文本字符串时比方说这是 www website1 com 这是 website2 com 我得到 www we
绘制对数轴

我想使用 matplotlib 绘制一张带有一个对数轴的图我一直在阅读文档但无法弄清楚语法我知道这可能很简单 scale linear 在情节争论中但我似乎无法正确理解示例程序 import pylab import matplo
使用 scipy、python、numpy 进行非线性 e^(-x) 回归

下面的代码为我提供了一条最佳拟合线的平坦线而不是沿着 e x 模型的一条适合数据的漂亮曲线谁能告诉我如何修复下面的代码以使其适合我的数据 import numpy as np import matplotlib pyplot as pl
在Python中整齐地绘制PMF

有没有一个库可以帮助我在 python 中整齐地绘制样本的概率质量函数如下所示通过matplotlib pyplot的stem模块 matplotlib pyplot stem args kwargs from matplotlib p
“DATETIME_INPUT_FORMATS”在 Django Admin 中不起作用，而“DATE_INPUT_FORMATS”和“TIME_INPUT_FORMATS”则可以

I use 日期时间字段 https docs djangoproject com en 4 2 ref models fields datetimefield 日期字段 https docs djangoproject com en 4
pandas groupby 并转换为 json 列表

我有一个如下所示的 pandas 数据框 idx f1 f2 f3 1 a a b 2 b a c 3 a b c 87 e e e 我需要将其他列转换为基于索引列的字典列表所以最终结果应该是 idx features 1 f1 a f
如何检查discord.py中的所有者

我试图让这个命令只有所有者才能运行它是否有办法检查服务器的最高角色或创建者我尝试了 commands is owner 但这仅检查某人是否是机器人的所有者 Guild owner https discordpy readthedocs
NumPy 根据另一个数组中的值对第三个数组中的每个匹配元素求和一个数组

我有两个 numpy 数组一个包含值另一个包含每个值类别 values np array 1 2 3 4 5 6 7 8 9 10 valcats np array 101 301 201 201 102 302 302 202 102
自动创建带有文件输出的目录[重复]

这个问题在这里已经有答案了假设我想制作一个文件 filename foo bar baz txt with open filename w as f f write FOOBAR 这给出了一个IOError since foo bar不存
__author__ 的起源是什么？

使用私有元数据变量的约定在哪里 author 一个模块内部从何而来 This http mail python org pipermail python dev 2001 March 013328 htmlPython 邮件列表线程似乎暗示
如何在 FastAPI Swagger API 中按方法类型对方法进行排序？

如何在 FastAPI Swagger 自动文档中设置 API 方法的排序顺序我希望所有方法按类型分组 GET POST PUT DELETE 这个答案 https stackoverflow com questions 24951268
如何仅在按下某个键时触发鼠标单击？在Python中

我想制作一个程序或者当我单击某个键时鼠标会自动单击只要我单击该键如果我不单击该键它就会停止我不希望只在触摸按键一次时才发生点击而是只要按住按键就发生点击也可以像雷蛇突触鼠标一样按下鼠标左键触发点击任何想法 EDIT 1 这
Django - 渲染到字符串无法加载 CSS

我正在尝试使用 Django 1 8 render to string 通过管理命令将 html 转换为 pdf 而不是使用 View request 以下代码可以将模板转换为 pdf 但它无法将 CSS 加载到模板中 def html t
如何动态选择要在flask中使用的模板目录？

默认情况下 Flask 使用存储在 template 目录中的模板文件 flaskapp application py templates hello html 有没有办法根据登录的用户动态选择模板目录这就是我想要的目录结构 flaska
如何将 Django 数据库中的模板标签解释/渲染为 HTML

我正在尝试添加带有来自 Django 管理站点的图像的帖子但安全自动转义关闭过滤器无法解释 Django 的模板标签 My input and page look like 复制图像地址给出http 127 0 0 1 8000 7B
如何将动态数据传递给装饰器

我正在尝试编写一个基本的 CRUD 控制器类来执行以下操作下列的 class BaseCrudController model field validation template dir expose self template dir
如何使用 PySpark 预处理图像？

我有一个项目需要为 1 设置大数据架构 AWS S3 SageMaker 的概念验证使用 PySpark 预处理图像 2 执行 PCA and 3 训练一些机器或深度学习模型我的问题是了解如何使用 PySpark 操作图像数据但无法在
如何使用多阶段构建减小 python (docker) 图像大小？

我正在寻找一种使用 python 和 Dockerfile 创建多阶段构建的方法例如使用以下图像第一张图片安装所有编译时要求并安装所有需要的 python 模块第二张图片将所有已编译构建的包从第一个映像复制到第二个映像而不

随机推荐

Excel.Application.SelectionChange 仅触发一次

我只收到第一个事件通知之后什么也没有发生有任何想法吗 UPD 我发现了一件奇怪的事情我的事件处理程序代码如下所示 var cell range Cells 1 1 var rangeName cell Address false fa
OnBackPressed 没有被调用？

我已经覆盖了OnBackPressed在我的活动中运行但它没有被调用在其他活动中它运行良好这是我的方法 Override public void onBackPressed Log e back 1 UserPage getstat
防止 sqlplus 截断列名，无需单独的列格式

默认情况下 sqlplus 将列名截断为基础数据类型的长度我们数据库中的许多列名称都以表名称为前缀因此在截断时看起来相同我需要在锁定的生产环境中向远程 DBA 指定 select 查询并拖回假脱机结果以进行诊断列太多无法指定各个
如何在 Swift 中正确测试 Core Data

已经有很多关于此的主题但我还没有找到适用于 Swift Xcode 6 2 的解决方案为了在 Swift 中测试 Core Data 支持的类我生成了新的托管对象上下文然后将其注入到我的类中 Given let testManage
从实例驻留在固定格式（数据库、MMF）的基类派生...如何安全？

Note 我正在寻找有关正确搜索词的任何建议来阅读此类问题对象关系映射 http en wikipedia org wiki Object relational mapping我想到了一个可以找到一些好的现有技术的地方但我还没有看到任何
CALayer 不显示

这是我第一次尝试使用 CALayer 构建成功并且没有报告错误所以我认为我一定做了一些明显错误的事情但该图层根本不显示 void viewDidLoad Get Reliant Magenta in amazingly verbose
正则表达式：忽略大小写

如何使以下正则表达式忽略大小写它应该匹配所有正确的字符但忽略它们是小写还是大写 G a b 假设你想要whole正则表达式忽略大小写你应该寻找i flag http www regular expressions info modif
Windows 8 的 mvvmlight 中缺少 EventToCommand 行为 - 解决方法？

问题确实说明了一切我正在使用 MVVM Light 用 XAML C 编写一个 Windows 8 应用程序我注意到 EventToCommand 功能尚未实现有人可以建议对此有任何解决方法吗 thanks 您现在可以使用 Event
使用带有二进制存档的 boost 序列化时出错

我在读取时收到以下错误boost archive binary iarchive进入我的变量 test serialization 9285 0x11c62fdc0 malloc can t allocate region mach vm
使用当前用户的凭据进行 javamail NTLM 身份验证

如何将 JavaMail API 与 NTLM 身份验证结合使用到 Exchange 服务器而无需指定用户名和密码而是自动使用当前登录用户的凭据单点登录我的目的是让我的客户端程序在我公司网络中的 Windows 计算机上运行能够
如何在 Prolog 中计算数字序列的和

任务是计算从0到M的自然数之和我使用SWI Prolog编写了以下代码 my sum From To From gt To my sum From To S From 0 Next is 1 S is 1 my sum Next To S
JMS队列消息接收顺序

我按顺序在同一目标中添加两条 JMS 消息这两条消息的接收顺序是否与我添加它们的顺序相同或者是否有可能进行相反的排序即首先检索目的地中首先接收到的消息我将添加到目的地 producer send Msg1 producer send
Groovy 二维数组

我有3个数组 l1 l2 and l3 每个都有 5 个字符 e g l1 A B C D E 二维数组由这些组成 screen l1 l2 l3 所以它看起来像这样 screen 我怎样才能迭代这个数组我打电话吗screen 5 or
在单个图中，由“标签”列分割的所有列的箱线图

看着箱线图 API 页面 http seaborn pydata org generated seaborn boxplot html seaborn boxplot 我想要看起来像这样的组合的东西 gt gt gt iris sns lo
gform_after_submission 发布到第三方 API

我正在尝试使用客户WordPress网站的functions php文件中的gform after submission钩子将这串信息发送到第三方API 此url由第三方客户提供我需要将其与每次注册相匹配这是我在 Functions p
使用 window.print 内容将网页下载为 pdf

我想要一个链接当单击该链接时会自动开始下载网页的可打印版本我正在使用Moodle 我想要的内容是完全相同的如果我使用 ctrl p 下载页面并保存为 pdf 或使用 a href Download web page a 我正是想要该内
根据自定义数组位置排序帖子

我想根据自定义字段列出帖子列表这里我有 9 个帖子有不同的 3 个位置中上下 Post ID title position 1 Post1 Top 2 Post2 Bottom 3 Post3 Top 4 Post4 Bottom
C# - 使用 TableAdapter 从存储过程返回单个值返回 null

我不明白但我添加到表适配器的存储过程仅返回空值它应该返回一个简单的整数值在我使用数据集设计器进行的预览中我可以清楚地获得我想要的整数值但由于某种原因我无法从我的代码中获取价值我按照MSDN库的说明进行操作 http msdn
对 solr 搜索结果进行排序。给出错误无法对多值字段进行排序：名称

我对 Apache Solr 搜索比较陌生我正在尝试对 Solr 查询中的结果集进行排序查询名称 abc AND 隐藏 false sort name desc 它显示错误无法对多值字段进行排序名称 Solr版本是 7 2 1 如
将列的百分比设置为 0 (pandas)

我有一个 pandas 数据框我想将列的某些百分比设置为 0 假设 df 有两列 A B 1 6 2 7 3 8 4 4 5 9 我现在想将 df 的前 20 和后 20 的 B 设置为 0 A B 1 0 2 7 3 8 4 4 5 0

将列的百分比设置为 0 (pandas)

将列的百分比设置为 0 (pandas) 的相关文章

随机推荐

热门标签