如何测试字符串包含列表中的元素并通过 Pandas 将目标元素分配给另一列

2024-02-25

我有一个一栏列表，展示了一些公司名称。其中一些名称包含国家/地区名称（例如，“中国 A1”中的“中国”，“芬兰的 C1”中的“芬兰”）。我想根据公司名称和由国家/地区名称组成的预定义列表提取其所属国家/地区。

原始数据框df像这样显示

    Company name    Country
0   China A1        
1   Australia-A2        
2   Belgium_C1      
3   C1  in  Finland
4   D1  of  Greece
5   E2  for Pakistan

目前我只能想出一个低效的方法。这是我的代码：

country_list = ['China','America','Greece','Pakistan','Finland','Belgium','Japan','British','Australia']
for t in country_list:
    df.loc[df['company name'].contains(t),'country']=t

结果显示像

    Company name    Country
0   China A1        China
1   Australia-A2    Australia   
2   Belgium_C1      Belgium
3   C1  in  Finland Finland
4   D1  of  Greece  Greece
5   E2  for Pakistan Pakistan

我认为当country_list包含大量元素（即国家）时，通过循环方法会很耗时。有没有更简单的方法来解决我的问题？

这是一种使用方法str.extract https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.extract.html:

df['Country'] = df['Company name'].str.extract('('+'|'.join(country_list)+')')

       Company name    Country
0          China A1      China
1      Australia-A2  Australia
2        Belgium_C1    Belgium
3   C1  in  Finland    Finland
4    D1  of  Greece     Greece
5  E2  for Pakistan   Pakistan

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

string

pandas

python27

DataFrame

如何测试字符串包含列表中的元素并通过 Pandas 将目标元素分配给另一列的相关文章

加速 Numpy 数组上的循环

在我的代码中我有一个 for 循环它对多维 numpy 数组进行索引并使用每次迭代时获得的子数组进行一些操作看起来像这样 for sub in Arr do stuff using sub 现在使用完成的东西sub是完全矢量化的所
从日志文件 python 创建 csv 标题

我的日志文件每行都包含一些信息如下所示 Info1 NewOrder key 123 Info3 10 Info5 abc Info3 10 Info1 OldOrder key 456 Info6 xyz Info1 NewOrder
python subprocess proc.stderr.read() 引入额外的行？

我想运行一些命令并抓取输出到 stderr 的任何内容我有两个版本的函数可以执行此操作版本 1 def Getstatusoutput cmd Return status output of executing cmd in a she
Python 字典不按顺序排列

我创建了一个字母表字典其值从0开始并根据单词文件增加一定的量我对最初的字典进行了硬编码我希望它保持按字母顺序排列但事实并非如此我希望它按字母顺序返回字典基本上与初始字典保持相同我怎样才能保持秩序 from wordData
python-click：添加修改其他参数行为的选项

这个问题是关于click http click pocoo org 5 包裹 Click 是一个用于创建漂亮命令行的 Python 包使用尽可能少的代码以可组合的方式进行接口它是命令行界面创建工具包它具有高度可配置性但带有开箱即用
NoneType 类型的对象没有 len

def medianeven L while len L gt 2 L L 1 len L 1 return average L def medianodd L while len L gt 1 L L 1 len L 1 return L
f.read 为空

我在解释器中完成这一切 loc1 council council1 file1 open loc1 r 此时我可以执行 file1 read 并将文件的内容作为字符串打印到标准输出但如果我添加这个 string1 file1 read 字
正则表达式 - Python - 删除前导空格

我使用正则表达式在文本文件中搜索产品一词然后我使用该搜索的起点和终点来查看该列并提取整数有些实例 A 列有我不想要的前导空格我只想将数字如 B 列中的数字打印到文件中没有前导空格正则表达式中的正则表达式有条件的 pr
如何使用Python从Excel复制图表并将其作为图表粘贴到powerpoint（而不是图像）中

我有一个excel文件它根据可用数据生成图表图表名称是thisChart 我想复制thisChart从 excel 文件到 ppt 文件现在我知道有两种方法可以做到这一点即VBA和python 使用win32com client V
在 Swift 中删除字符串中第一个字符的最简洁方法是什么？

我想删除字符串中的第一个字符到目前为止我想到的最简洁的事情是 display text display text substringFromIndex advance display text startIndex 1 我知道我们不能用
在地图类型中创建 DataFrame 分组列

My 数据框具有以下结构 df spark createDataFrame B a 10 B b 20 C c 30 Brand Type Amount df show Brand Type Amount B a 10 B b 20 C c
使用 pywin32com 进行 opc 的内存泄漏

我很难弄清楚如何解决内存泄漏问题我认为这可能是 pywin32 的问题但我不完全确定我用于读取写入单个项目的代码似乎工作得很好但是当使用组函数时它会慢慢泄漏内存我怀疑这是来自必须在 server handles 中传递的基于
kombu.exceptions.EncodeError：用户不可 JSON 序列化

我有 django 1 11 5 应用程序和 celery 4 1 0 我一直收到 kombu exceptions EncodeError
采用迭代器而不是可迭代的方法[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案关于迭代器和可迭代对象仅是我的观察如果我错了请纠正我大多数构造函数数组类型将迭代器作为质量构造函数迭代器是显式创建的或
使用不同的 CMD 名称同时运行多个 python 脚本

我尝试通过 multiprocessing Process 在 test py 中同时调用 a py 和 b py 它起作用了但过程CMDa py b py 和 test py 的名称相同均为 usr bin python tmp te
API 调用时出现 UnicodeEncodeError (json)

我正在尝试打印此 API 调用的结果但收到 UnicodeEncodeError 可能是超级菜鸟问题但非常感谢任何帮助 import http client import json api key hidden connection h
替换 XSLT 中的特殊字符

我想从 XSLT 中的字符串中删除字母以外的字符例如
为什么 `Pool.map()` 多处理中的内存消耗急剧增加？

我正在对 pandas 数据帧进行多重处理方法是将其拆分为多个数据帧这些数据帧存储为列表并且使用Pool map 我将数据帧传递给定义的函数我的输入文件约为 300 mb 因此小数据帧大约为 75 mb 但是当多处理运行时内存
如何在seaborn displot上绘制正态曲线

distplot 已被弃用取而代之的是 displot 之前的函数可以选择绘制正态曲线 import seaborn as sns import matplotlib pyplot as plt from scipy import sta
为什么 Pytest 对夹具参数执行嵌套循环

使用 Pytest 我想编写一个测试函数该函数接受多个装置作为参数每个灯具都有几个参数例如 test demo py 中是一个函数test squared is less than 10需要固定装置 negative integer

随机推荐

AttributeError：模块对象没有属性“Series”。代码可以在 iPython 中运行

子模块不是隐含地进口的并且必须是明确地声明但我正在做一个explicit致电pd Series子模块不是吗无论如何不应该import pandas as pd允许pd Series被称为下面的代码可以完美地工作iPython
如何设置最小屏幕尺寸？

我创建了新的应用程序不适用于手机我的应用程序基于 7 英寸平板设备当我尝试将我的应用程序放入 Play 商店时它显示我的应用程序支持 2000 种 Android 设备但并非所有设备都是平板电脑事实上我不想用谷歌搜索所有设备并
在 io.js 中使用 Smalloc

第一个版本为io js https iojs org api smalloc html本月发布我在阅读文档时发现smalloc https iojs org api smalloc htmlio js 中引入的新模块直到今天我还从未觉得
如何删除 Mercurial 中应用于错误分支的一些提交，然后在正确的分支上重播它们？

我的同事在错误的分支上的存储库上提交了两次采取这两个提交删除它们然后将它们正确提交到正确的分支下的最有效方法是什么更改尚未推送理想情况下我们希望有一种方法可以在 TortoiseHG 中执行此操作但当然如果命令行是最佳选择我
如何在 Vue 上下文中动态向条形图/饼图添加点？

我想引导一个 Highcharts 条形图然后向其中添加一些点在 Vue 容器中文档提到addPoint https api highcharts com class reference Highcharts Series addPo
将unicode插入sqlite？

我仍在学习 Python 作为一个小项目我编写了一个脚本它将获取文本文件中的值并将它们插入到 sqlite3 数据库中但有些名称有奇怪的字母我猜你会称它们为非 ASCII 并且当它们出现时会生成错误这是我的小脚本请告诉我是否有更
WPF 中 ListBoxItem 上的虚线边框

如何将 ListBoxItems 上的默认边框设置为虚线边框请参阅以下样式设置方法
您知道哪些避免条件分支的技术？

有时 CPU 花费大部分时间的循环经常会出现一些分支预测缺失错误预测概率接近 0 5 我见过一些关于非常孤立的线程的技术但从未见过一个列表我所知道的已经修复了条件可以转换为布尔值并且以某种方式使用 0 1 进行更改的情况还有其他可
Solr中如何对多个字段进行嵌套聚合？

我正在尝试以嵌套方式按多个字段执行搜索结果聚合计数和总和例如通过本文末尾显示的模式我希望能够获得按类别分组并按子类别进一步细分的大小的总和并得到如下所示的内容
Android Studio：“无法获取 org.gradle.api.Project 类型项目的未知属性‘VERSION_NAME’”

我是 Android Studio 的新手我正在尝试使用这个项目库 https github com 2dxgujun AndroidTagGroup https github com 2dxgujun AndroidTagGroup在我
如何在 IndexedDB 的一个事务中放置多个请求

我的代码如下 var f1 function trans var store trans objectStore ObjectStore store clear var f2 function trans var store trans o
我如何测试 cookie 是否使用 php 设置，如果未设置则不执行任何操作

我试过了 cookie COOKIE cookie 如果未设置 cookie 则会出现错误 PHP ERROR Undefined index cookie 我如何防止它给我一个空变量 gt Use isset http php net i
如何获取mongoDB集合的排名位置？

我有一个 mongoDB 集合如下所示 id 1 name John Doe company Acme email email protected cdn cgi l email protection matches 171844 169
适用于 Android 的 Google Chrome 远程调试 - “localhost:9222”不可用

我正在按照步骤启用远程调试 https developers google com chrome mobile docs debugging https developers google com chrome mobile docs de
为什么 .filter() 在 Internet Explorer 8 中不起作用？

这是行 songs songs filter function el return el album album 这是错误对象不支持此属性或方法这在 Chrome 中 100 正常工作这是怎么回事 Array filter 直到版本
Intellij IDEA 部署缓慢（已过时）

安装新版本的 IDEA 14 后 maven 项目的部署显着增加从 15 秒增加到 47 秒 REASON IDEA用途bundledMaven 版本解决方案设置 ctrl alt S gt Maven gt Maven home d
实施个人用户帐户和 Azure AD 身份验证

我想看看是否可以在单个应用程序中同时使用个人用户帐户身份验证和 Azure AD 身份验证框架或核心 ASP NET 到目前为止我一直在谷歌搜索但我没有找到任何明确说明可以做到这一点的内容其次除了个人广告或天蓝色广告的基础知识记
在 Jetpack Compose 中导航到没有先前支架的另一个屏幕

我的应用程序有一个带有脚手架和底部导航栏的主屏幕 override fun onCreate savedInstanceState Bundle super onCreate savedInstanceState setContent va
如何使用导航架构组件创建BottomSheetDialogFragment？

我在用BottomSheetDialogFragment用于显示一些自定义设置要求当我单击 BottomSheetDialogFragment 中的任何选项卡时我会替换该片段并将其添加到后台堆栈以便当用户单击 onBackPress
如何测试字符串包含列表中的元素并通过 Pandas 将目标元素分配给另一列

我有一个一栏列表展示了一些公司名称其中一些名称包含国家地区名称例如中国 A1 中的中国芬兰的 C1 中的芬兰我想根据公司名称和由国家地区名称组成的预定义列表提取其所属国家地区原始数据框df像这样显示 Company

如何测试字符串包含列表中的元素并通过 Pandas 将目标元素分配给另一列

如何测试字符串包含列表中的元素并通过 Pandas 将目标元素分配给另一列 的相关文章

随机推荐

热门标签

如何测试字符串包含列表中的元素并通过 Pandas 将目标元素分配给另一列的相关文章