需要在 Python Pandas 中过滤几列并更改其中一列的值

2024-01-14

我有一个包含 150.000 行和 15 列的表。此示例的重要列是 COUNTRY、COSTCENTER 和 EXTENSION。我正在将 CSV 读入 Pandas Dataframe。所有列都是对象类型。

我想做的是：

搜索某个国家/地区（例如“中国”）
筛选 COSTCENTER 为 1000 或 2000 或 EXTENSION 以“862”开头的实例
应用所有过滤器后，将 COUNTRY 中的国家/地区名称更改为新名称。

我有一个解决方案，但我总是收到有关链接问题的警告：

df.COUNTRY[df.COUNTRY.str.match("China") &
                (df.COSTCENTER.str.match("1000") |
                 df.COSTCENTER.str.match("2000"))] = 'China_new_name'

我不能说，我完全理解为什么我会在这里遇到问题，但我正在寻找替代方案。我尝试使用 lambda 和 apply，但不断收到各种错误。

我现在最新的做法是：

filter_China = df.ix[(df["COUNTRY"]=="China") &
((df["COSTCENTER"]=="1000") | (df["COSTCENTER"]=="2000"))]

它似乎过滤了我正在寻找的内容（我还没有包括对扩展的搜索，因为我首先希望它起作用）。

但是，当我尝试根据我的搜索条件更改值时，我遇到了麻烦：

df.ix[(df["COUNTRY"]=="China") & ((df["COSTCENTER"]=="1000") | 
(df["COSTCENTER"]=="2000")), df["COUNTRY"]] = "China_new_name"

我收到此错误： raise KeyError('%s not in index' % objarr[mask])

我在这里缺少什么？这种方法是正确的还是我需要走一条完全不同的路线？

您需要阅读文档部分 http://pandas.pydata.org/pandas-docs/stable/indexing.html#why-does-assignment-fail-when-using-chained-indexing关于链式索引和SettingWithCopy warning

df.loc[df.COUNTRY.str.match("China") &
                (df.COSTCENTER.str.match("1000") |
                 df.COSTCENTER.str.match("2000")), "COUNTRY"] = 'China_new_name'

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

需要在 Python Pandas 中过滤几列并更改其中一列的值的相关文章

在python中将数据库表写入文件的最快方法

我正在尝试从数据库中提取大量数据并将其写入 csv 文件我正在尝试找出最快的方法来做到这一点我发现在 fetchall 的结果上运行 writerows 比下面的代码慢 40 with open filename a as f writ
Mypy 无法从文字列表推断项目的类型

我有一个变量x和一个文字列表例如 0 1 2 我想转换x这些文字之一如果x在列表中我将其退回否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
从 Azure ML 实验中访问 Azure Blob 存储

Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块但是我需要将 JSON 文件写入 blob 存储由于没有模块可以执行此操作因此我尝试在Ex
使用 Paramiko 进行 DSA 密钥转发？

我正在使用 Paramiko 在远程服务器上执行 bash 脚本在其中一些脚本中存在与其他服务器的 ssh 连接如果我只使用 bash 不使用 Python 我的 DSA 密钥将被第一个远程服务器上的 bash 脚本转发并使用以连接
协程从未被等待

我正在使用一个简单的上下文管理器其中包含一个异步循环 class Runner def init self self loop asyncio get event loop def enter self return self def e
如何确保 re.findall() 停止在正确的位置？

这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
在Python上获取字典的前x个元素

我是Python的新手所以我尝试用Python获取字典的前50个元素我有一本字典它按值降序排列 k 0 l 0 for k in len dict d l 1 if l lt 51 print dict 举个小例子 dict d m
Arcpy 模数在 Pycharm 中不显示

如何将 Arcpy 集成到 Pycharm 中我尝试通过导入模块但它没有显示我确实知道该模块仅适用于 2 x python arcpy 在 PyPi Python 包索引上不可用因此无法通过 pip 安装要使用 arcpy 您需要
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
Python HMAC：类型错误：字符映射必须返回整数、None 或 unicode

我在使用 HMAC 时遇到了一个小问题运行这段代码时 signature hmac new key secret key msg string to sign digestmod sha1 我收到一个奇怪的错误 File usr loca
根据其他单元格值更改多个单元格值

我想更改包含的单元格moving to movingToOpenor movingToClose基于下一个单元格中给出的状态有时循环会被中断并且不会从open to close or close to open 这是我当前的数据框 Dat
pandas 相当于 np.where

np where具有向量化 if else 的语义类似于 Apache Spark 的when otherwise数据帧方法我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
给定一个排序数组，就地删除重复项，使每个元素仅出现一次并返回新长度

完整的问题我开始在线学习 python 但对这个标记为简单的问题有疑问给定一个排序数组就地删除重复项使得每个元素只出现一次并返回新的长度不分配另一个数组的额外空间您必须通过修改输入来完成此操作数组就地具有 O 1 额外内
Python 中维基百科 API 中的 DisambiguationError 和 GuessedAtParserWarning

我想获得维基百科与搜索词相关的可能且可接受的名称列表在这种情况下是电晕当输入以下内容时 print wikipedia summary Corona 这给出了以下输出 home virej local lib python3 8 si
使用 Python 将连续日期分组在一起

Given dates datetime 2014 10 11 datetime 2014 10 1 datetime 2014 10 2 datetime 2014 10 3 datetime 2014 10 5 datetime 201
XPath：通过当前节点属性选择当前和下一个节点的文本

首先这是从我之前的问题 https stackoverflow com questions 5202187 xpath select current and next nodes text by current node attribut
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
如何在亚马逊 EC2 上调试 python 网站？

我是网络开发新手这可能是一个愚蠢的问题但我找不到可以帮助我的确切答案或教程我工作的公司的网站用 python django 构建托管在亚马逊 EC2 上我想知道从哪里开始调试这个生产站点并检查存储在那里的日志和数据库我有帐户信
如何将带有参数的Python装饰器实现为类？

我正在尝试实现一个接受一些参数的装饰器通常带有参数的装饰器被实现为双重嵌套闭包如下所示 def mydecorator param1 param2 do something with params def wrapper fn def

随机推荐

使用sql从多个字段中选择不同的字段

我有 5 列对应于问答游戏数据库中的答案对错 1 错 2 错 3 错 4 我想返回所有可能的答案而不重复我希望在不使用临时表的情况下完成此任务是否可以使用类似的东西 select c1 c2 count from t group b
受保护的成员/字段真的那么糟糕吗？

现在如果您阅读 MSDN 中 C 的命名约定您会注意到它指出属性始终优先于公共字段和受保护字段有些人甚至告诉我你永远不应该使用公共或受保护的领域现在我同意我还没有找到需要拥有公共领域的理由但受保护的领域真的那么糟糕吗如果您需要
原始变量和引用变量的内存分配[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions type name 对于引用类型这
Java：返回 java.util.Date 格式的字符串[重复]

这个问题在这里已经有答案了我将以 201201 格式接收输入即 YYYYMM 格式现在我想按原样返回值 201201 但它应该采用 java util Date 格式我很困惑 String strDate 201201 Simple
Hadoop 溢出故障

我目前正在开发一个使用 Hadoop 0 21 0 985326 以及一个由 6 个工作节点和一个头节点组成的集群的项目提交常规 MapReduce 作业失败但我不知道为什么以前有人见过这个异常吗 org apache hadoop
MS-SQL 查询 - 更新通过存储过程检索的记录

UPDATE 现在范围已经稍微扩大了我现在需要检索字段 Id uri linkTo 这如何改变事情我正在使用 MS SQL 2005 数据库并具有以下存储过程 CREATE PROCEDURE dbo getNewAds region
将数据发送到单独的窗口 javascript

我使用以下命令从现有页面创建了一个新的弹出窗口 window open myUrl myName width 200 height 200 现在在该弹出窗口上我有一个文本输入和一个按钮我想为按钮创建一个 onclick 方法将文本输
三星 G5 setvisibility 出现空指针异常

Android 应用代码可在各种设备上成功运行包括早至 API 14 至 API 19 目标但是 Samsung G5 v4 4 4 在尝试为活动设置 Visibilty true 时会抛出 NPE 此错误可能仅在最近通过 Sprint
编组通知包

我正在尝试将通知对象写入文件我能找到的最好方法是将对象写入包编组该包以获取字节然后将其写入文件 Parcel notif Parcel obtain notification writeToParcel notif 0 byte no
当 Go 返回多个值时到底发生了什么

Go 函数和方法可以返回多个值 func learnMultiple x y int sum prod int return x y x y return two values 总和产品 learnMultiple 10 50 是不是和返
是否可以更改 Java ME 中的垃圾收集行为？

我想知道是否可以调整垃圾收集器在 JavaMe 上的工作方式以某种方式提高性能可能会减少段落数量我看过一些关于它的文章但大多是针对 Java SE 的其中大多数都说 GC 高度依赖于制造商那会是多少呢垃圾收集器何时被触发在很大
如何在Featuretools中实现加权和变换基元？

我试图弄清楚如何为Featuretools 实现加权总和原语权重应取决于 time since last 就像 cum sum 金额 sum i exp a i amount i where i正在滚动 6 个月期在上面你可以找到原来的
当弹出窗口处于活动状态时，如何与 ionic 中的后台项目进行交互？

离子版本 1 x 平台全部我有一个使用离子弹出框的离子应用程序但是当弹出窗口处于活动状态打开时我无法再与后台中的事物交互例如向下滚动我的项目列表我曾尝试寻找此问题的现有答案但没有看到提出的问题弹出窗口本身不必绑定到页面
AngularJs 如何从轮询服务获取数据到控制器

我有这个service它检查后端是否有新数据它工作正常但问题是我无法使用从服务到控制器的数据 watch也不使用promise SERVICE service notificationPollService function q htt
Create-react-app 控制台显示块文件

I would like to debug some errors happening during my React development As you can see I can t see the source files I am
Exoplayer 从字节数组播放音频 - ByteArrayDataSource

使用 Exoplayer 我尝试播放字节数组中的音频文件我正在尝试使用 ByteArrayDataSource 但在调用构造函数时出现错误 new ByteArrayDataSource data 这是我想出的代码 private voi
角度表达式在 Chrome 扩展中计算，但在 Edge 扩展中不计算

我有一个简单的浏览器扩展使用 Angular v1 6 3 但是浏览器扩展的弹出窗口中的 Angular 表达式无法在 Edge 中计算但在 Chrome 中却可以 Angular 的表达式很简单 div 2 2 div 当我浏览到相关
排序在 jQuery 数据表中不起作用

我在一页中有两个内联表排序适用于一个数据表但不适用于其他数据表一次调用两个 div 但排序仅适用于一个数据表 div1 DataTable processing true destroy true paginate true leng
使用 jQuery 和 asp.net 转发器自动完成填充 ID

我有一个带有自动完成功能的 asp Textbox 数据来自网络服务并返回 Json 数据当选择一个项目时它会将一个值 id 放入隐藏字段中并将价格放入另一个文本框中这一切都很好但是当我将或多或少相同的代码放入 asp rep
需要在 Python Pandas 中过滤几列并更改其中一列的值

我有一个包含 150 000 行和 15 列的表此示例的重要列是 COUNTRY COSTCENTER 和 EXTENSION 我正在将 CSV 读入 Pandas Dataframe 所有列都是对象类型我想做的是搜索某个国家地区

需要在 Python Pandas 中过滤几列并更改其中一列的值

需要在 Python Pandas 中过滤几列并更改其中一列的值 的相关文章

随机推荐

热门标签

需要在 Python Pandas 中过滤几列并更改其中一列的值的相关文章