Pandas：无法根据字符串相等性进行过滤

2024-03-20

在 python 2.7、OSX 上使用 pandas 0.16.2。

我从 csv 文件中读取数据框，如下所示：

import pandas as pd

data = pd.read_csv("my_csv_file.csv",sep='\t', skiprows=(0), header=(0))

的输出data.dtypes is:

name       object
weight     float64
ethnicity  object
dtype: object

我期待名称和种族的字符串类型。但我在这里找到了为什么它们在较新的 pandas 版本中是“对象”的原因。

现在，我想根据种族选择行，例如：

data[data['ethnicity']=='Asian']
Out[3]: 
Empty DataFrame
Columns: [name, weight, ethnicity]
Index: []

我得到相同的结果data[data.ethnicity=='Asian'] or data[data['ethnicity']=="Asian"].

但是当我尝试以下操作时：

data[data['ethnicity'].str.contains('Asian')].head(3)

我得到了我想要的结果。

但是，我不想使用“包含” - 我想检查是否直接相等。

请注意data[data['ethnicity'].str=='Asian']引发错误。

难道我做错了什么？如何正确地做到这一点？

您的字符串中可能有空格，例如，

data = pd.DataFrame({'ethnicity':[' Asian', '  Asian']})
data.loc[data['ethnicity'].str.contains('Asian'), 'ethnicity'].tolist()
# [' Asian', '  Asian']
print(data[data['ethnicity'].str.contains('Asian')])

yields

  ethnicity
0     Asian
1     Asian

要从字符串中去除前导或尾随空格，您可以使用

data['ethnicity'] = data['ethnicity'].str.strip()

之后，

data.loc[data['ethnicity'] == 'Asian']

yields

  ethnicity
0     Asian
1     Asian

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

string

pandas

Filtering

Selection

Pandas：无法根据字符串相等性进行过滤的相关文章

如何提取图像中的表格

我想从图像中提取表格这个 python 模块https pypi org project ExtractTable https pypi org project ExtractTable 与他们的网站https www extractta
在Python中解析制表符分隔的文件

我正在尝试在 Python 中解析一个制表符分隔的文件其中与行开头分开的 k 个制表符的数字应该放入第 k 个数组中除了逐行读取并执行简单解决方案将执行的所有明显处理之外是否有内置函数可以执行此操作或者有更好的方法您可以使用the
在 C# 中追加到空字符串是如何工作的？

我很惊讶地看到一个字符串被初始化为 null 然后在生产环境中附加一些内容的示例只是闻起来不对劲我确信它会抛出空对象异常但这个大大简化的示例也有效 string sample null sample test sample equal
python 命令行应用程序的最佳布局是什么？

什么是正确的方法或者我会满足于good方式布置一个中等复杂度的命令行 python 应用程序我使用 Paster 创建了一个 Python 项目框架它为我提供了一些文件 myproj init py MyProj egg info
将 python 嵌入到我的应用程序中时出现内存泄漏

以下程序与 python 2 7 13 链接并在 Windows 10 上运行时缓慢但稳定地泄漏内存 include
Java 按日期作为字符串对列表进行排序

我有一个类型列表我想按日期元素对该列表进行排序我用谷歌搜索看到了一些具有可比性的解决方案但是是否有可能在不实现类中接口的情况下做到这一点我的列表如下所示列表 id 33 文本 test1 日期 06 02 15 id 81 文本
pyspark.pandas 与 pandas 有什么区别？

开始在 Databricks 上使用 PySpark 我发现我可以导入pyspark pandas旁边pandas 有什么不同我认为这不像koalas right PySpark 是 Python 中 Apache Spark 的接口它
在 Mac 上安装 python igraph

我执行了brew install homebrew science igraph当我执行时sudo pip3 install python igraph 我收到以下错误 Cannot find the C core of igraph on
ValueError: n_splits=10 不能大于每个类中的成员数

我正在尝试运行以下代码 from sklearn model selection import StratifiedKFold X hey join now hello join today join us now not today jo
尝试从 C# 调用简单的 Python 脚本，但由于“无法获取 Python 编解码器”致命错误而失败。我怎样才能解决这个问题？

相关的C 代码片段如下 static string CallPython string fileName Process p new Process p StartInfo new ProcessStartInfo C Python310
如何在Python中打印带下划线的内容？

print hello 输出应该是单词 hello 但有下划线您可以通过使用转义字符来做到这一点 print 033 4mhello 033 0m
我从 clojure 和 python 中得到的 hmac 签名略有不同

我从 python 实现和 clojure 实现中获得的 HMAC SHA1 签名略有不同我很困惑什么会导致这种情况 Python实现 import hashlib import hmac print hmac new my key my
如何使用基于令牌的访问获取虚拟机的 GCP 配额限制

我想使用基于令牌的访问来获取 GCP VM 限制下面是我的Python代码 from googleapiclient import discovery from oauth2client import AccessTokenCredent
使用 NumPy 查找元组列表第二个元素的中位数

假设我有一个元组列表如下所示 list a 1 b 3 c 5 我的目标是使用元组的第二个元素来获取元组列表中位数的第一个元素在上面的情况下我想要 b 的输出因为中位数是 3 我尝试使用 NumPy 和以下代码但无济于事 impo
如何在matplotlib_venn中将维恩图保存为PNG图

使用以下代码我尝试创建维恩图然后另存为文件 import matplotlib from matplotlib venn import venn2 set1 set A B C D set2 set B C D E plt venn2 s
使用 python mechanize 库登录 https 站点

我有以下代码 import requests import sys import urllib2 import re import mechanize import cookielib import json import imp prin
运行迁移时出错：sqlalchemy.exc.CompileError：Postgresql ENUM 类型需要名称

当我第一次尝试运行升级时遇到此错误尽管我已经给了它一个 name 属性但它似乎在性别类型枚举上失败了有解决办法吗有什么方法可以查看生成的 SQL 内容吗这是我的 models py 这是我运行flask ext migrate u
用 pandas 查找树中叶节点的所有祖先

我有一个表有两列父和子这是从 SAP ERP 下载的 SETNODE 表需要在 python 中创建一个数据框其中每个级别作为其自己的列相对于其父级和之前的所有级别在Python 3 中完整关系的级别数量未知或始终变化
在python中求Legendre多项式的根

我正在编写一个程序通过勒让德高斯求积求解积分 n 阶求积算法需要在某一时刻找到 n 阶勒让德多项式 Pn x 的根并将它们分配给数组 Absc 表示横坐标 Pn 是一个 n 阶多项式在区间 1 1 上有 n 个独立的实根我希望能
Keras 导入错误 Nadam

我在尝试导入 Keras 模块 Nadam 时遇到导入错误 gt gt gt from keras optimizers import Nadam Traceback most recent call last File

随机推荐

优化 iPhone / iPod touch 上的二进制应用程序大小

我知道用户只能通过 3G 下载最多 20MB 而我的构建发布 iphoneos 显示我的应用程序为 26MB 我正在链接到 Three20 iPhone 框架这是提交到 App Store 时计入 20MB 最大值的最终大小吗我能做些
Angular 2 中的条件验证

Angular 2 中的验证非常简单这非常棒然而如果选择了其他字段如何将必填字段设置为可选字段这是我的规则 this contractsFilter this fb group selectedContractType Valid
如何从url中提取域名？

如何使用 bash 从 url 中提取域名喜欢 http example com http example com 到 example com 必须适用于任何 TLD 而不仅仅是 com 您可以使用简单的AWK方式提取域名如下所示 ec
如何将整数放入数字数组[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我想将像 123456 这样的数字放入数字数组中您能给我一个关于该过程的提示吗我可以定义一个元素数量未知的数组吗首先计算数字的个数
UWP 应用程序 WebView 泄漏内存，无法清除图像

Problem WebView 加载图像后不释放内存如果所有 WebView 实例都被销毁几秒钟内存似乎会被释放我们从 XAML 树中删除并清除了代码中的所有引用我们在调试器中检查了当时所有实例都已释放这个解决方案是有问题的因为
变量重定义，嵌入式c

我正在开发一个嵌入式 c 项目并且遇到全局变量重新定义的问题我已将函数声明和定义分成几个 h 和 c 文件其中许多函数需要访问全局变量这些变量在 global vars h 中定义因此在头文件的开头 ifndef define
在 C++11 中从 C++17 重新实现 std::map::try_emplace() ？

std map try emplace http en cppreference com w cpp container map try emplace看起来非常方便和高效但它仅在 C 17 中可用是否可以在 C 11 中重新实现它 t
webpack-dev-server 断开连接并尝试重新连接...垃圾邮件

我刚刚完成了我正在做的一个有角度的项目但是我注意到控制台中的某些内容如果是的话我很想隐藏它可能只是为了保持一切整洁这是 webpack dev server 模块不断断开连接并尝试重新连接并向我的控制台日志发送垃圾邮件像这样
使用“自定义用户模型”删除“webhook”错误（Django）

我正在尝试配置 Django Stripe 订阅现在尝试设置 webhook 以通过以下代码创建新的客户数据 views py import stripe from django conf import settings from dja
如何使用 php cURL 下载文件并将其保存到本地路径

我有一个网址如下 www domain com file asp File peoples csv 在浏览器中点击此 URL 时会强制下载文件但我想使用 CURL 在本地路径上下载此文件有什么办法吗谢谢帮助好的找到解决方案了分享
VIM 恢复上次搜索模式

我重新映射 and 查找文件中的上一个和下一个模式映射如下 nmap section
获取多个元素的引用

我有一堆动态创建的输入字段 tr td td tr
快速可靠地查明源代码文件是否实现接口的方法

给定一个java源代码文件有什么快速可靠的方法来查明它是否实现了给定的接口一种可靠的方法是将文件解析为语法树使用例如 Eclipse 的 ASTNode 类并查找正确的节点一种快速的方法是查找带有 implements 的行剔除
如何在不使用 go-flutter 的情况下在 flutter 桌面中使用 image_picker 插件

我正在尝试在我的 flutter 桌面项目中使用 image picker 插件但我认为这个插件没有与 Windows 桌面应用程序一起使用的实现有人有解决办法吗 Ps 我想使用 go flutter 和悬停有两种选择实施适用于 W
复制 Magento 站点

复制 Magento 网站有多容易有多难我的公司使用 Magento 为客户开发了一个英国网站事实证明这很受欢迎因此客户现在要求制作该网站的美国版本据我所知该网站将 99 相同只是指向不同的数据库针对不同的产品也许还有一
使用独立应用程序将数据添加到 HTTPRepository 时出现 RDF4J RIO UnsupportedRDFormatException

我有一个HTTPRepository使用存储库的 URL 进行初始化我用一个RepositoryConnection检索天气数据并将其添加到存储库从 Web 服务检索数据然后将其转换为 RDF 语句并添加到存储库中这是由独立应
如何使用 Spring MVC 为每个对象传递列表参数？

我正在使用 Spring MVCRequestMapping这里是为了GET参数下面是我的代码 RequestMapping value index method RequestMethod GET public HashMap
如何在多个其他构建完成后在 teamcity 中构建一个项目而不触发依赖链？

我的问题与在 TeamCity 中进行多个并行构建后触发一次后续构建 https stackoverflow com questions 19806689 trigger subsequent build once after multip
React-datepicker：仅在 18 岁及以上时才启用设置日期

我有一个表单用户可以在其中提交一些所需的信息其中一个字段是出生日期我在用反应日期选择器 https github com Hacker0x01 react datepicker该特定领域的包一段代码如下所示
Pandas：无法根据字符串相等性进行过滤

在 python 2 7 OSX 上使用 pandas 0 16 2 我从 csv 文件中读取数据框如下所示 import pandas as pd data pd read csv my csv file csv sep t skipr

Pandas：无法根据字符串相等性进行过滤

Pandas：无法根据字符串相等性进行过滤 的相关文章

随机推荐

热门标签

Pandas：无法根据字符串相等性进行过滤的相关文章