使用字典替换列值

2024-04-02

我有这个数据框，其中性别预计为男性或女性。

from io import StringIO
import pandas as pd

audit_trail = StringIO('''
course_id AcademicYear_to months TotalFee Gender
260 2017 24 100 male
260 2018 12 140 male
274 2016 36 300 mail
274 2017 24 340 female
274 2018 12 200 animal
285 2017 24 300 bird
285 2018 12 200 maela
''')

df11 = pd.read_csv(audit_trail, sep=" "  )

我可以使用字典纠正拼写错误。

corrections={'mail':'male', 'mael':'male', 'maae':'male'}
df11.Gender.replace(corrections)

但我正在寻找一种方法，仅保留男性/女性和“其他”类别的其余选项。预期输出：

0      male
1      male
2      male
3    female
4    other
5    other
6      male
Name: Gender, dtype: object

添加另外两个虚拟条目到您的corrections dict:

corrections = {'male'   : 'male',    # dummy entry for male
               'female' : 'female',  # dummy entry for female
               'mail'   : 'male', 
               'maela'  : 'male', 
               'maae'   : 'male'}

现在，使用map and fillna:

df11.Gender = df11.Gender.map(corrections).fillna('other')
df11

   course_id  AcademicYear_to  months  TotalFee  Gender
0        260             2017      24       100    male
1        260             2018      12       140    male
2        274             2016      36       300    male
3        274             2017      24       340  female
4        274             2018      12       200   other
5        285             2017      24       300   other
6        285             2018      12       200    male

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Dictionary

DataFrame

replace

使用字典替换列值的相关文章

在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
Django 模型在模板中不可迭代

我试图迭代模型以获取列表中的第一个图像但它给了我错误即模型不可迭代以下是我的模型和模板的代码我只需要获取与单个产品相关的列表中的第一个图像模型 py class Product models Model title models
从零开始的 numpy 形状意味着什么

好的我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况这对我来说是有意义的它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑为什么这么定义呢据我所知这只是表达空数组的
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
从 python 发起 SSH 隧道时出现问题

目标是在卫星服务器和集中式注册数据库之间建立 n 个 ssh 隧道我已经在我的服务器之间设置了公钥身份验证因此它们只需直接登录而无需密码提示怎么办我试过帕拉米科它看起来不错但仅仅建立一个基本的隧道就变得相当复杂尽管代码示例将受
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
Seaborn Pairplot 图例不显示颜色

我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常但由于某种原因图例不会显示相关的颜色我无法找到解决方案因此如果有人有任何建议请告诉我 x sns pairplot stats2 hue
在 pytube3 中获取 youtube 视频的标题？

我正在尝试构建一个应用程序来使用 python 下载 YouTube 视频pytube3 但我无法检索视频的标题这是我的代码 from pytube import YouTube yt YouTube link print yt titl
Pandas 根据 diff 列形成簇

我正在尝试使用 Pandas 根据表示时间以秒为单位的列中的差异来消除数据框中的一些接近重复项例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
使用yield 进行字典理解

作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
检查字典键是否有空值

我有以下字典 dict1 city name yass region zipcode phone address tehsil planet mars 我正在尝试创建一个基于 dict1 的新字典但是它不会包含带有空字符串的键它不会包
列表值的意外更改

这是我的课 class variable object def init self name name alias parents values table name of the variable self name 这是有问题的函数 f

随机推荐

Python：如何让程序等待函数或方法完成

程序经常需要等待函数完成其工作有时恰恰相反主程序不需要等待我举了一个简单的例子有四个按钮单击每个将调用相同的calculate 函数唯一的区别是函数的调用方式直接打电话使用队列每个线程完成后将结果放入队列中然后您只需读取
我必须使用 SVN API 或库访问/提交/更新 WPF 应用程序中的 SVN 存储库 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案任何可用于从 net 应用程序访问 SVN 的好库使用 C 到目前为止我发现的唯一 3 个我会尝试的
如何使用 easy_install 安装 django 旧版本？

我刚刚因为 django 1 3 破坏了我的环境我的网站都无法运行因此我决定使用 virtualenv 来设置不同 python 版本以及 django 的虚拟环境但是似乎如果我下载软件包并使用 sudo python setup
阵列部件访问

我试图更好地理解数组请原谅我的基本问题因为我三周前刚刚打开我的第一本 php 书我知道您可以使用 foreach 或 for 循环检索键值对如下所示 stockprices array Google gt 800 Apple g
II 错误：应用程序代码隐藏=“Global.asax.cs”继承=“nadeem.MvcApplication”

我正在尝试部署我的网络项目但不断收到此错误 Line 1 我看了这个帖子解析器错误应用程序中的服务器错误 https stackoverflow com questions 11596352 line 1 application co
MySQL Regexp 是否支持 Unicode 匹配

有谁知道Mysql的正则表达式是否支持unicode 我一直在做一些研究大多数博客等似乎都表明存在问题或不受支持我想知道是否最好使用 LIKE 进行 unicode 模式匹配使用 regexp 进行 ASCII 增强模式匹配我喜欢能
具有非正则截距项的 Scikit-learn 岭回归

scikit learn 岭回归是否在正则化项中包含截距系数如果是是否有办法在不正则化截距的情况下运行岭回归假设我拟合岭回归 from sklearn import linear model mymodel linear model
RxJS forkJoin 未完成

当我订阅 getAllSubModules 时 forkJoin 会毫无错误地执行所有这些可观察值但不会完成我知道 forkJoin 仅在其所有可观察值完成后才完成但作为证据我在控制台中看到 3 次这确认一切都成功因此所有可观察
jqGrid 过滤器工具栏仅显示单列的搜索运算符选择器

我有包含许多列的 jqGrid 表使用过滤器工具栏在网格中进行搜索对于大多数人来说搜索只是简单的默认运算符对于一个日期时间列我需要不同类型的运算符和日期选择器选择器我已经添加了dataInit日期选择器初始化为searchopt
如何将最后 N 次提交压缩在一起？

如何将最后 N 次提交压缩为一次提交你可以很容易地做到这一点无需git rebase or git merge squash 在此示例中我们将压缩最后 3 个提交如果您想从头开始编写新的提交消息这就足够了 git reset so
java/oops 中静态变量和动态变量有什么区别？

请有人告诉我 oops 或 java 中静态变量和普通变量之间的区别如果可能的话还有它们的用法考虑一个具有静态和动态变量的类动态变量创建类的实例时每个对象都有自己的动态变量副本对于每个对象该变量的值都将不同无论在该
使用 Jest 模拟 jsonwebtoken 模块

我尝试用玩笑来模拟 npm 模块 jsonwebtoken 的验证功能该函数返回一个已解码的令牌但我想将此函数的自定义返回传递给我的单元测试我明确请求在继续请求之前检查访问令牌的有效性但我想模拟令牌检查的时刻以直接返回用户值并且轻
使用过滤器或挂钩修改购物车总量

好吧我正在尝试编写一个过滤器或挂钩它将根据购物车中的商品总数来修改购物车的总量例如如果购物车中有三件商品我想从总订单中扣除二十美元下面是我到目前为止的代码非常感谢任何帮助 add filter woocommerce cart
CookieContainer 错误？

我很困惑 CookieContainer 如何处理域所以我创建了这个测试此测试显示 cookieContainer 不会为 example com 返回任何 cookie 但根据 RFC 它应该返回至少 2 个 cookie 这不是一个
SunGridEngine、Condor、Torque 作为 PVM 的资源管理器

有人知道哪个资源管理器适合 PVM 吗或者我不应该使用 PVM 而是依赖 MPI 或其任何版本例如 MPICH 2 还有其他更好的吗使用 PVM 的主要原因是因为在我之前开始这个项目的人假设使用 PVM 然而现在这个项目是我的了他
将内存流中的图像添加到 Excel 文档

我在内存流中有一个图像我想将其写入 MS Excel 文档 PIA 仅公开采用文件路径的 AddPicture 方法有没有办法无需将图像写入光盘即可添加图片 MSDN http msdn microsoft com en us libr
经典 ASP 中的超时问题

我正在开发一个经典的 ASP 项目在从数据库填充数据并将其绑定到 UI 中时遇到超时问题我们得到以下错误脚本超时超出了脚本执行的最长时间您可以通过为 Server Scripttimeout 属性指定新值或更改 IIS 作为管理工
我使用 document.getelementsbyclassname 是否错误？

当我输入文本框的值必须是并且颜色必须是红色我必须对三个文本框使用相同的函数当我使用 document getelementsbyclassname 时我的函数将无法工作难道我做错了什么
VS 2008 Web 部署 - 防止文件夹被删除

我有一个 ASP NET MVC 2 项目该项目是使用 Web 部署项目 Visual Studio 2008 构建和部署的该网站的根目录中有一个上传文件夹用户生成的图像将保存到其中每当构建运行使用 team city 时上传文
使用字典替换列值

我有这个数据框其中性别预计为男性或女性 from io import StringIO import pandas as pd audit trail StringIO course id AcademicYear to months T

使用字典替换列值

使用字典替换列值 的相关文章

随机推荐

热门标签

使用字典替换列值的相关文章