Pandas 根据拆分另一列添加新列

2024-03-28

我有一个如下所示的 pandas 数据框：

A              B
US,65,AMAZON   2016
US,65,EBAY     2016

我的目标是看起来像这样：

A              B      country    code    com
US.65.AMAZON   2016   US         65      AMAZON
US.65.AMAZON   2016   US         65      EBAY

我知道这个问题之前已经被问过here https://stackoverflow.com/questions/14745022/pandas-dataframe-how-do-i-split-a-column-into-two and here https://stackoverflow.com/questions/25789445/pandas-make-new-column-from-string-slice-of-another-column#_=_ but none其中一些对我有用。我努力了：

df['country','code','com'] = df.Field.str.split('.')

and

df2 = pd.DataFrame(df.Field.str.split('.').tolist(),columns = ['country','code','com','A','B'])

我错过了什么吗？任何帮助深表感谢。

您可以使用split http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.split.html带参数expand=True并添加一个[]到左侧：

df[['country','code','com']] = df.A.str.split(',', expand=True)

Then replace http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.replace.html , to .:

df.A = df.A.str.replace(',','.')

print (df)
              A     B country code     com
0  US.65.AMAZON  2016      US   65  AMAZON
1    US.65.EBAY  2016      US   65    EBAY

另一种解决方案是DataFrame构造函数，如果没有NaN values:

df[['country','code','com']] = pd.DataFrame([ x.split(',') for x in df['A'].tolist() ])
df.A = df.A.str.replace(',','.')
print (df)
              A     B country code     com
0  US.65.AMAZON  2016      US   65  AMAZON
1    US.65.EBAY  2016      US   65    EBAY

您也可以在构造函数中使用列名称，但是然后concat http://pandas.pydata.org/pandas-docs/stable/generated/pandas.concat.html是必要的：

df1=pd.DataFrame([x.split(',') for x in df['A'].tolist()],columns= ['country','code','com'])
df.A = df.A.str.replace(',','.')
df = pd.concat([df, df1], axis=1)
print (df)
              A     B country code     com
0  US.65.AMAZON  2016      US   65  AMAZON
1    US.65.EBAY  2016      US   65    EBAY

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas 根据拆分另一列添加新列的相关文章

Python 是否有与 PHP 函数 htmlspecialchars() 等效的函数？

Python 中是否有与 PHP 函数 htmlspecialchars 类似或等效的函数到目前为止我发现的最接近的是htmlentitydefs entitydefs 我所知道的最接近的是cgi escape http docs pyt
使用 BeautifulSoup 在 python 中抓取多个页面

我已经设法编写代码来从第一页中抓取数据现在我不得不在这段代码中编写一个循环来抓取接下来的 n 页下面是代码如果有人可以指导帮助我编写从剩余页面中抓取数据的代码我将不胜感激 Thanks from bs4 import Beauti
为什么playsound函数无法在python中播放我的mp3文件

所以基本上我试图创建一个音乐播放程序可以在您要求时播放音乐我只是想让歌曲播放部分实际工作所以我编写了一个超级简单的代码来测试它 import playsound playsound sample mp3 This was done i
Python/pandas：从两个数据帧中查找匹配值并返回第三个值

我有两个不同的数据帧 df1 df2 具有完全不同的形状 df1 64 6 df2 564 9 df1 包含一列 df1 objectdesc 其中的值字符串也可以在 df2 df2 objdescription 的列中找到由于两个数
dask groupby 不合并分区

我有一组数据我想要对其进行一些简单的 groupby count 操作但我似乎无法使用 dask 来完成此操作我很可能不理解 dask 中执行 groupby reduce 的方式特别是当索引位于分组键中时所以我将用玩具数据来说明
GitPython 并向 Git 对象发送命令

GitPython http gitorious org git python是一种从 python 与 git 交互的方式我正在尝试访问基本的 git 命令例如git commit m message 从此模块中根据this htt
将文件转换为 Ascii 抛出异常

后果我之前的问题 https stackoverflow com questions 31742609 how to strip the leading unciode characters from a file 31742694 nor
打开文件对象的大小

有没有办法找到当前打开的文件对象的大小具体来说我正在使用 tarfile 模块来创建 tarfile 但我不希望 tarfile 超过特定大小据我所知 tarfile 对象是类似文件的对象所以我想通用的解决方案会起作用 ls la
如何使用不同的类和导入动态地使用 Python 日志记录来更改文件句柄

我无法执行即时日志文件句柄更改例如我有3节课 one py import logging class One def init self txt logging debug Hey I m the class One and I say
尝试导入 cv2(opencv-python) 包时出错

我正在尝试使用 cv2 opencv python 包访问我的网络摄像头当我尝试导入它时出现此错误 Traceback most recent call last File server py line 6 in
计算具有不均匀间隔点的 3D 梯度

我目前有一个由几百万个不均匀间隔的粒子组成的体积每个粒子都有一个属性对于那些好奇的人来说是潜力我想计算其局部力加速度 np gradient 仅适用于均匀分布的数据我在这里查看 numpy 中的二阶梯度 https stackov
Python 和 Scipy：如何拟合冯·米塞斯分布？

我正在尝试拟合来自 scipy 的冯米塞斯分布 http docs scipy org doc scipy reference generated scipy stats vonmises html http docs scipy org
跳过一个端点的 Flask 日志记录？

我有一个 Python Flask 应用程序有一项运行状况检查经常访问一个端点但我不想在日志中看到它如何仅禁用一个 GET 端点的日志记录而保留其他所有端点的日志记录艾蒂安贝尔萨克为我指明了正确的方向这就是我的实现方式 fro
Python 比 C++ 更快、更轻吗？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
R - 小鼠 - 添加一列，对具有估算值的列进行求和

我有一个缺少数据的数据库我需要估算数据我使用的是小鼠然后根据原始列创建新列使用估算数据我需要用这些新列进行统计分析具体来说我的参与者使用 7 点李克特量表填写了几份调查问卷有些人没有回答所有问题然后我需要估算值 1 对列中
将多列传递给 groupby.transform

据我所知当您使用 DataFrame 列调用 groupby transform 时该列将传递给转换数据的函数但我无法理解的是如何将多个列传递给函数 people DataFrame np random randn 5 5 colum
Scipy：在对整个表面进行集成时加快集成速度？

I have a probability density function pdf f x y And to get its cumulative distribution function cdf F x y at point x y y
将行追加到 Pandas DataFrame 添加 0 列

我正在创建一个 Pandas DataFrame 来存储数据不幸的是我无法提前知道我将拥有的数据行数所以我的方法如下首先我声明一个空的 DataFrame df DataFrame columns col1 col2 然后我附加
根据 pandas 中其他数据帧的值更改一个数据帧的值

我有一个数据框 df1 id value 1 100 2 100 3 100 4 100 5 100 我有另一个数据框 df2 id value 2 50 5 30 我想用 df1 中的值替换 df2 中 id 的这些值最终修改后的df1
在 Pandas DataFrame 中拆分列表

我有一个包含多列的 csv 文件使用 pandas 我将此 csv 文件读入数据帧并有一个日期时间索引和五六个其他列其中一列是时间戳列表下面带有索引的示例 CreateDate TimeStamps 4 1 11 Timestamp

随机推荐

状态模式与 ENUM

有时需要支持对象的状态据我了解有两种方法枚举简单 STATE模式 OC原理显然需要使用状态模式来达到这样的目的我不确定但是阅读其他代码时我经常遇到的只是枚举而不是状态模式状态模式有权力吗通常 ENUM 方法涉及某种状态和转
在保护模式下读取键盘

我正在尝试制作 PS 2 键盘控制器但无法正常工作 outb 0x60 0xED outb 0x60 2 Turn on CapsLock LED doesn t works char c 0 while c 1 if inb 0x60
如何正确清除singleTop Activity中的意图数据？

场景是在清单中声明了 singleTop 的活动这个活动被称为带有一些额外的内容我能够清除意图数据并能够翻转屏幕等而无需调用原始意图问题是当系统终止该活动并且用户返回该活动时它会使用创建该活动的原始意图重新启动我该如何删除这
获取用于 Azure Web PubSub Rest API 的 JWT 承载令牌进行身份验证

我正在开发一个项目其中我通过 Azure Web PubSub 服务构建一个发布订阅系统 JavaScript 客户端订阅者通过套接字连接能够接收 Hub 上和 Group 中发布的消息为此我遵循了本教程 https lear
如何指定浮点数的舍入模式？

我想将浮点数四舍五入到最接近的整数当存在最接近的整数时趋向正无穷大 use std num Float fn main assert eq 0 0 0 5 round fails 但是文档round say 将中途情况舍入到远离
Windows XP 性能监视器应用程序 (perfmon) 中缺少处理器/内存计数器

Perfmon 是一个 Windows 实用程序可通过测量系统计数器帮助开发人员找到应用程序中的瓶颈我正在读一本性能监控教程 http adminfoo net 2007 04 windows perfmon top ten count
使用串口通过 Arduino 将多个值发送到 Raspberry

我有一个关于 Arduino 和 Raspberry Pi 之间串行通信的问题事实上我想使用 Arduino 将 2 个变量发送到 Raspberry Pi 并以不同的方式使用它们这是我的 Arduino 草图 int one 1 i
格式化 HDFS 时出现 UnknownHostException

我已经使用以下命令在伪分布式模式下在 CentOS 6 3 64 位上安装了 CDH4指示 https ccp cloudera com display CDH4DOC Installing CDH4 on a Single Linux N
如何使用 Python 在网格中创建 10 个随机 x、y 坐标

我需要创建一个 8x8 网格并将 10 个硬币分布在网格上的随机位置我面临的问题是 randint 函数有时会生成相同的随机坐标因此只生成 9 或 8 个硬币并放置在网格上我怎样才能确保这种情况不会发生干杯这是我到目前为止的代码
在 SpannableStringBuilder 中对齐位图

如何将位图与 SpannableString 中的文本对齐 SpannableStringBuilder ssb new SpannableStringBuilder arr messages get position String msg
CloudFront 分配未显示为 Route53 别名目标

我正在尝试添加指向我的 Cloudfront 分发的路线 53 记录集但是当我在路由 53 中选择创建记录集并单击后续面板中的别名目标时未列出云前端分布我得到的只是没有可用的目标我的发行版已创建并已启用并且正在运行我已在
ChromeDriver 2.33 的 driver.manage().window().maximize() 问题

ChromeDriver 2 33 的发行说明表示修复了导致调整大小定位窗口命令在 Chrome 62 上失败的错误但是当我使用 Chrome 62 浏览器时这似乎仍然是一个问题使用 chrome 驱动程序最大化 chrome 窗口
如何在 PHP 中设置 $PATH？

我目前正在开发自己的小项目但有一个小问题我想将 PATH 环境变量设置为 bin 这样当我使用exec 和类似的功能它只会搜索该目录中的二进制文件除非我明确告诉它我已经尝试过了putenv 除非我启用了安全模式否则它将无法工作
Elasticsearch - 如果术语出现频率越高，得分越高

我有 2 个文档正在搜索关键字 Twitter 假设两个文档都是带有标签字段的博客文章文档 A 在标签字段中只有 1 个术语它是 Twitter 文档 B 在标签字段中有 100 个术语但其中 3 个是 Twitter
Erlang 代码的持续集成服务器

您使用什么类型的敏捷工具进行 Erlang 开发什么持续集成 http en wikipedia org wiki Continuous integration您使用 CI 服务器来构建 Erlang 代码吗我得到的唯一参考来自 Quo
Maven 中央存储库的官方镜像有哪些？

有谁知道是否有已知和工作的 Maven 中央存储库 http repo1 maven org maven2 镜像的列表如果没有当中央存储库关闭时您使用什么镜像这是取自 rvxnet 的答案以及为什么仅链接答案不可取的示例我从20
Tomcat 的接受计数

我对Tomcat有以下问题acceptCount 它说当所有传入连接请求的最大队列长度可能的请求处理线程正在使用中收到的任何请求当队列已满时将被拒绝默认值为 10 我不确定这是如何运作的我的意思是我知道有一个单独的 TCP 队列
QScreenRayCaster 未找到实体。我做错了什么？

Qt3D 中新 QScreenRayCaster 的描述看起来正是我想要使用的但我无法让它为我工作我想在初始化中我需要做一些事情但我在网上找不到任何示例来为我指明正确的方向我编写了一个非常简单的程序来测试该功能它在窗口的中心绘制一
Spring Security 将 URL 参数传递给身份验证提供程序

有没有办法将 URL 参数传递给 Spring Security 3 中的身份验证提供程序我们的登录页面需要接收电子邮件令牌作为参数身份验证系统在设置用户状态时需要了解该参数具体来说它将允许具有正确令牌的用户登录否则该用户将无法登
Pandas 根据拆分另一列添加新列

我有一个如下所示的 pandas 数据框 A B US 65 AMAZON 2016 US 65 EBAY 2016 我的目标是看起来像这样 A B country code com US 65 AMAZON 2016 US 65 AMAZ

Pandas 根据拆分另一列添加新列

Pandas 根据拆分另一列添加新列 的相关文章

随机推荐

热门标签

Pandas 根据拆分另一列添加新列的相关文章