在 pandas 数据框中映射值的范围[重复]

2024-01-22

如果之前有人问过这个问题，我深表歉意，但我广泛查看后没有结果。

import pandas as pd    
import numpy as np    
df = pd.DataFrame(data = np.random.randint(1,10,10),columns=['a'])    

   a
0  7
1  8
2  8
3  3
4  1
5  1
6  2
7  8
8  6
9  6

我想创建一个新专栏b映射了几个值a根据某种规则，假设 a=[1,2,3] 为 1，a = [4,5,6,7] 为 2，a = [8,9,10] 为 3。一对一映射我很清楚，但是如果我想按值列表或范围进行映射怎么办？

我沿着这些思路思考......

df['b'] = df['a'].map({[1,2,3]:1,range(4,7):2,[8,9,10]:3})

有几种选择。

熊猫通过`pd.cut`/ NumPy 通过`np.digitize`

您可以构建边界列表，然后使用专业库函数。这在@EdChum 的解决方案 https://stackoverflow.com/a/50098390/9209546，并且也在这个答案 https://stackoverflow.com/a/49382340/9209546.

NumPy 通过`np.select`

df = pd.DataFrame(data=np.random.randint(1,10,10), columns=['a'])

criteria = [df['a'].between(1, 3), df['a'].between(4, 7), df['a'].between(8, 10)]
values = [1, 2, 3]

df['b'] = np.select(criteria, values, 0)

的要素criteria是布尔级数，所以对于lists值，您可以使用df['a'].isin([1, 3]), etc.

字典映射通过`range`

d = {range(1, 4): 1, range(4, 8): 2, range(8, 11): 3}

df['c'] = df['a'].apply(lambda x: next((v for k, v in d.items() if x in k), 0))

print(df)

   a  b  c
0  1  1  1
1  7  2  2
2  5  2  2
3  1  1  1
4  3  1  1
5  5  2  2
6  4  2  2
7  4  2  2
8  9  3  3
9  3  1  1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

binning

在 pandas 数据框中映射值的范围[重复] 的相关文章

元组有什么用？

我现在正在学习 Python 课程我们刚刚介绍了元组作为数据类型之一我阅读了它的维基百科页面但是我无法弄清楚这种数据类型在实践中会有什么用处我可以提供一些需要一组不可变数字的示例吗也许是在 Python 中这与列表有何不同每
在 django ORM 中查询时如何将 char 转换为整数？

最近开始使用 Django ORM 我想执行这个查询 select student id from students where student id like 97318 order by CAST student id as UNSIG
如何用python脚本控制TP LINK路由器

我想知道是否有一个工具可以让我连接到路由器并关闭它然后从 python 脚本重新启动它我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器但是
如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

我正在尝试使用全向模块 http docs opencv org trunk db dd2 namespacecv 1 1omnidir html用于对鱼眼图像进行扭曲处理Python 我正在尝试适应这一点C 教程 http docs op
安装了 32 位的 Python，显示为 64 位

我需要运行 32 位版本的 Python 我认为这就是我在我的机器上运行的因为这是我下载的安装程序当我重新运行安装程序时它会将当前安装的 Python 版本称为 Python 3 5 32 位然而当我跑步时platform arch
用枢轴点拟合曲线 Python

我有下面的图我想用 2 条线来拟合它使用 python 我设法适应上半部分 def func x a b x np array x return a x b popt pcov curve fit func up x up y 我想用另
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
Pandas Merge (pd.merge) 如何设置索引和连接

我有两个 pandas 数据框 dfLeft 和 dfRight 以日期作为索引 dfLeft cusip factorL date 2012 01 03 XXXX 4 5 2012 01 03 YYYY 6 2 2012 01 04 XX
在Python中连接反斜杠

我是 python 新手所以如果这听起来很简单请原谅我我想加入一些变量来生成一条路径像这样 AAAABBBBCCCC 2 2014 04 2014 04 01 csv Id TypeOfMachine year month year
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
datetime.datetime.now() 返回旧值

我正在通过匹配日期查找 python 中的数据存储条目我想要的是每天选择今天的条目但由于某种原因当我将代码上传到 gae 服务器时它只能工作一天第二天它仍然返回相同的值例如当我上传代码并在 07 01 2014 执行它时它
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
javascript 是否有等效的 __repr__ ？

我最接近Python的东西repr这是 function User name password this name name this password password User prototype toString function r
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
使用for循环时如何获取前一个元素？ [复制]

这个问题在这里已经有答案了可能的重复 Python 循环内的上一个和下一个值 https stackoverflow com questions 1011938 python previous and next values inside
如何应用一个函数 n 次？ [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案假设我有一个函数它接受一个参数并返回相同类型的结果 def increment x return x 1 如何制作高阶函数repeat可以
Pandas 每周计算重复值

我有一个Dataframe包含按周分组的日期和 ID df date id 2022 02 07 1 3 5 4 2022 02 14 2 1 3 2022 02 21 9 10 1 2022 05 16 我想计算每周有多少 id 与上周重
cv2.VideoWriter：请求一个元组作为 Size 参数，然后拒绝它

我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频构造 VideoWriter 对象时文档表示 Size 参数应该是一个元组当我给它一个元组时它拒绝它当我尝试用其他东西替换它时它不会接受它因为它说参数不是

随机推荐

用于几何入口点的 SceneKit 着色器修改器适用于 iOS，但不适用于 OS X

我正处于制作 SceneKit 着色器修改器用于几何入口点的早期阶段该修改器根据高度图纹理置换平面的几何形状计划是用它来创建地形在 iOS 编辑 iOS 模拟器中着色器按其应有的方式工作但会将此警告打印到控制台 SceneK
Xamarin Forms 错误 =>“jarsigner.exe”退出，代码为 1

我越来越 jarsigner exe 退出代码为 1我必须更改密钥库位置我不知道如何在 Windows 中以 xamarin 形式进行更改 bcoz 我将此项目从 MAC 复制到 Windows 并且在 PROGUARD 中遇到问题因为
Visual Studio Code 无法打开源文件“iostream”

我是 C 和 Visual Studio Code 的新手所以我不知道如何解决这个问题我尝试过阅读教程在 Visual Studio Code 中使用 Clang https code visualstudio com docs cpp
将向量初始化为零 C++/C++11

我知道在 C 11 中他们添加了将变量初始化为零的功能 double number number 0 int data data 0 有没有类似的方法来初始化std vector固定长度全为零您不需要为此初始化列表 std vector
类没有名为的成员

我在使用我的类对象访问类中的函数时遇到问题main功能我只是想为该类创建对象并使用该对象来访问该类内部的函数 cpp文件我不断收到错误我什至编写了最简单的程序来测试它但仍然收到错误 Main include
处理 IDisposable 对象处置的通用函数

我正在开发一个处理大量 Sql 对象的类 Connection Command DataAdapter CommandBuilder 等在多个实例中我们有这样的代码 if command null command Dispose if
iOS：以编程方式创建 UIWindow 导致位置错误

在 iOS 5 1 1 中我发现如果我创建 UIWindow 我厌倦了 IB 并将其框架设置为 UIScreen mainScreen bounds 则窗口会显示状态栏下然而如果我在 iOS 6 上做同样的事情它就会出现在状态栏正下
Json 对象数组长度

我正在使用一些类似于以下内容的 Json Apps Name app1 id 1 groups id 1 name test group 1 desc this is a test group id 2 name test group 2
将 DVCS 与 Visual Source Safe 相结合

我在工作中被迫使用 Visual Source Safe 2005 我想将其与 DVCS 结合起来这样我就可以在本地签入文件而不会在出现错误或无法编译时打扰我的同事在我对 Mercurial 的尝试中它有效但会导致一些奇怪的问题
Azure 角色间同步

我想知道同步运行相同角色的多个 azure 实例的最佳实践更准确地说我想防止多个工作角色在同一工作单元上工作 Azure 队列似乎对这个问题没有帮助一种选择是使用带有锁和存储过程的 sql 表但是在Azure中使用sql同步似乎有点
酒庄类型的索引在哪里？

我想构建一个备用的 Winery 模式解码器所以我查看了一些编码模式 Codec Winery gt B unpack serialiseSchema schema Proxy Proxy Void 4 5 0 Codec Winery
在 Elasticsearch 中建模父/子关系（产品/产品变体）

使用 ES 或 Solr 对产品变体进行建模让我大吃一惊考虑人为的例子不同的产品例如 T 恤每个产品都有一组属性 productid name desc brand color popularity 每个产品都有一组具有属性的产品
为什么我们不能有静态外部类[重复]

这个问题在这里已经有答案了为什么我们不能创建外部的静态类我在这个社区中阅读了该问题的答案但还没有得到完美的答案有人可以帮我一个确切的答案吗 static class A void display System out println
Excel 文件格式无法用 Pandas 确定，随机发生

我有一个编辑 xlsx 文件的脚本一年半以来我每周都成功运行直到上周开始出现此错误 Excel file format cannot be determined you must specify an engine manually d
Excel VBA查询外部.aspx页面并检索数据

我已经为此苦苦挣扎了大约一天基本上我想编写一个 Excel 宏来循环遍历 Excel 中的列表查询网页并检索一些数据理想情况下我只想检索所需的数据以便将其放置在相邻的单元格中但此时我会尽一切努力页面是ASP net 我没有经
有没有 XSLT 处理命令行工具？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我想通过 XSLT 文件和 XSLT 处理工具将 XML 文件更改为修改后的 XML 文件例如 xs
在 Objective C 中通过 POST 上传图像

我目前正在通过 HTTP Post 将图像上传到服务器但似乎无法找到构建调用该服务的 url 的方法用户从库或相机中选择图像然后调用执行插入语句的 json 服务该服务需要以下 uritemplate DataTransfer Se
使用 setup.py 自定义 python 包目录布局

假设我有以下目录结构 src python generated init py a py lib init py b py 我的是什么setup py需要看起来像这样才能创建目录布局如下的 dist src python init py a
使用任务并行库时如何处理所有未处理的异常？

我正在使用 TPL 任务并行库 http msdn microsoft com en us library dd460717 28v VS 100 29 aspx 在 NET 4 0中我想通过使用集中所有未处理异常的处理逻辑Thread
在 pandas 数据框中映射值的范围[重复]

这个问题在这里已经有答案了如果之前有人问过这个问题我深表歉意但我广泛查看后没有结果 import pandas as pd import numpy as np df pd DataFrame data np random randi

在 pandas 数据框中映射值的范围[重复]

熊猫通过pd.cut/ NumPy 通过np.digitize

NumPy 通过np.select

字典映射通过range

在 pandas 数据框中映射值的范围[重复] 的相关文章

随机推荐

热门标签

熊猫通过`pd.cut`/ NumPy 通过`np.digitize`

NumPy 通过`np.select`

字典映射通过`range`