删除 pandas DataFrame 列中字符串条目的末尾

2024-01-26

我有一个 pandas Dataframe，其中一列是文件列表

import pandas as pd
df = pd.read_csv('fname.csv')

df.head()

filename    A    B    C
fn1.txt   2    4    5
fn2.txt   1    2    1
fn3.txt   ....
....

我想删除文件扩展名.txt从每个条目filename。我该如何实现这个目标？

I tried:

df['filename'] = df['filename'].map(lambda x: str(x)[:-4])

但是当我随后查看列条目时df.head()，什么也没有变。

如何做到这一点？

我想你可以使用str.replace http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.replace.html使用正则表达式.txt$' ( $ - 匹配字符串的结尾 https://docs.python.org/2/library/re.html):

import pandas as pd

df = pd.DataFrame({'A': {0: 2, 1: 1}, 
                   'C': {0: 5, 1: 1}, 
                   'B': {0: 4, 1: 2}, 
                   'filename': {0: "txt.txt", 1: "x.txt"}}, 
                columns=['filename','A','B', 'C'])

print df
  filename  A  B  C
0  txt.txt  2  4  5
1    x.txt  1  2  1

df['filename'] = df['filename'].str.replace(r'.txt$', '')
print df
  filename  A  B  C
0      txt  2  4  5
1        x  1  2  1

df['filename'] = df['filename'].map(lambda x: str(x)[:-4])
print df
  filename  A  B  C
0      txt  2  4  5
1        x  1  2  1

df['filename'] = df['filename'].str[:-4]
print df
  filename  A  B  C
0      txt  2  4  5
1        x  1  2  1

EDIT:

rstrip如果字符串末尾包含条纹字符串的某些字符（在本例中），则可以删除更多字符., t, x):

Example:

print df
  filename  A  B  C
0  txt.txt  2  4  5
1    x.txt  1  2  1

df['filename'] = df['filename'].str.rstrip('.txt')

print df
  filename  A  B  C
0           2  4  5
1           1  2  1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

stringmatching

删除 pandas DataFrame 列中字符串条目的末尾的相关文章

Pandas：GroupBy 到 DataFrame

参考这个关于 groupby 到 dataframe 的非常流行的问题 https stackoverflow com questions 10373660 converting a pandas groupby object to dat
保留完整姓氏，在 pandas 列中获取名字的首字母（如果有的话，还有中间名）

我有一个 pandas 数据框其中有一列表示几位网球运动员的姓氏和姓名如下所示 Player 0 Roddick Andy 1 Federer Roger 2 Tsonga Jo Wilfred 我想保留完整的姓氏并获取姓名的首字母和中
pyspark 数据框中的自定义排序

是否有推荐的方法在 pyspark 中实现分类数据的自定义排序我理想地寻找 pandas 分类数据类型提供的功能因此给定一个数据集Speed列可能的选项是 Super Fast Fast Medium Slow 我想实现适合上下文的
Mac OS X 中文件系统的 Unicode 编码在 Python 中不正确？

在 OS X 和 Python 中处理 Unicode 文件名有点困难我试图在代码中稍后使用文件名作为正则表达式的输入但文件名中使用的编码似乎与 sys getfilesystemencoding 告诉我的不同采取以下代码 usr b
工作日重新订购 Pandas 系列

使用 Pandas 我提取了一个 CSV 文件然后创建了一系列数据来找出一周中哪几天崩溃最多 crashes by day bc DAY OF WEEK value counts 然后我将其绘制出来但当然它按照与该系列相同的排名顺序绘制
Keras：如何保存模型或权重？

如果这个问题看起来很简单我很抱歉但是阅读 Keras 保存和恢复帮助页面 https www tensorflow org beta tutorials keras save and restore models https www t
在 matplotlib 中的极坐标图上移动径向刻度标签

From matplotlib 示例 http matplotlib org examples pylab examples polar demo html import numpy as np import seaborn as sbs
Django send_mail SMTPSenderRefused 530 与 gmail

一段时间以来我一直在尝试使用 Django 从我正在开发的网站接收电子邮件现在我还没有部署它并且我正在使用Django开发服务器我不知道这是否会影响它这是我的 settings py 配置 EMAIL BACKEND djang
Python新式类和__subclasses__函数

有人可以向我解释为什么这有效在 Python 2 5 中 class Foo object pass class Bar Foo pass print Foo subclasses 但这不是 class Foo pass class Ba
使用 python 绘制正值小提琴图

我发现小提琴图信息丰富且有用我使用 python 库 seaborn 然而当应用于正值时它们几乎总是在低端显示负值我发现这确实具有误导性尤其是在处理现实数据集时在seaborn的官方文档中https seaborn pydata
Jython 和 SAX 解析器：允许的实体不超过 64000 个？

我做了一个简单的测试xml saxJython 中的解析器在处理大型 XML 文件 800 MB 时遇到以下错误 Traceback most recent call last File src project xmltools py li
SocketIO + Flask 检测断开连接

我在这里有一个不同的问题但意识到它可以简化为如何检测客户端何时从页面断开连接关闭其页面或单击链接换句话说套接字连接关闭我想制作一个带有更新用户列表的聊天应用程序并且我在 Python 上使用 Flask 当用户连接时浏览器发
Django Admin 中的反向内联

我有以下 2 个型号现在我需要将模型 A 内联到模型 B 的页面上模型 py class A models Model name models CharField max length 50 class B models Model n
如何与其他用户一起使用 pyenv？

如何与其他用户一起使用 pyenv 例如如果我在用户 test 的环境中安装了 pyenv 则当我以 test 身份登录时可以使用 pyenv 但是当我以其他用户例如 root 身份登录时如何使用 pyenv 即使你这么做了我也会s
如何根据第一列创建新列，同时考虑Python Pandas中字母和列表的大小？ [复制]

这个问题在这里已经有答案了我在 Python Pandas 中有 DataFrame 如下所示 col1 John Simon prd agc Ann White BeN and Ann bad list Ben Wayne 我需要这样做
双击打开 ipython 笔记本

相关文章通过双击 osx 打开 ipython 笔记本 https stackoverflow com questions 16158893 open an ipython notebook via double click on osx
python 线程安全可变对象复制

Is 蟒蛇的copy http docs python org 2 library copy html模块线程安全吗如果不是我应该如何在 python 中以线程安全的方式复制 deepcopy 可变对象蟒蛇的GIL http en w
从 pandas DataFrame 中删除少于 K 个连续 NaN

我正在处理时间序列数据我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题我尝试查看一些链接例如标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此
多个对象以某种方式相互干扰[原始版本]

我有一个神经网络 NN 当应用于单个数据集时它可以完美地工作但是如果我想在一组数据上运行神经网络然后创建一个新的神经网络实例以在不同的数据集甚至再次同一组数据上运行那么新实例将产生完全错误的预测例如对 XOR 模式进行训练

随机推荐

SQL1159 DB2 .NET 数据提供程序初始化错误，原因代码 2

我正在尝试从运行 Windows 7 64 位的开发机器中的 NET 2 0 应用程序连接到 DB2 我在 open 方法中收到此错误无法找到解决方案异常类型 InvalidOperationException ExceptionMes
在 OpenCV 中将较小的图像叠加在较大的图像中

我想用 Opencv 中的图像替换图像的一部分 I used cvGetPerspectiveMatrix with a warpmatrix and using cvAnd and cvOr 但无法让它发挥作用这是当前显示图像和替换图像
浏览器不请求 favicon.ico 的原因有哪些？

我正在编写一个位于服务器根目录的简单网页其快捷方式图标位于 favicon ico 但我的浏览器从不请求此 favicon ico 我在 html 中包含了以下内容当我打开开发人员工具的网络选项卡时我看到对 192 168 0 1 网
使用 group_by 的简单 Rails 3.1 视图

我正在工作的网站上有一个菜单食物菜单表中的每条记录还包含一个类别字段此类别可以是汉堡零食饮料或他们想要对食品进行分类的任何其他内容我正在尝试显示菜单其中的项目按此类别字段分组到目前为止我的尝试 food item menus
RESTEasy 无法识别自定义消息正文编写器

我的MessageBodyWriter Provider Produces text csv public class CSVMessageBodyWriter implements MessageBodyWriter
.NET Core Web API 5.0 构建错误

严重性代码说明项目文件行抑制状态错误 NETSDK1005 资产文件 D Working On Gra Gra obj project assets json 没有 NETCoreApp Version v5 0 的目标确保恢复已运
列依赖于其他列值

我有一列将具有三个可能的值稍后可能会更多我将其存储为枚举 yes immediately yes later no 如果选择yes later制作完成后我们还需要存储date该事件应该发生在我看来这必须是另一篇专栏我的问题是设计
作为收件人，是否可以检测电子邮件是通过 Gmail“安排发送”还是“发送”发送的？

只是好奇 Gmail 是否对电子邮件标头进行了标记以指示电子邮件是已安排发送还是立即发送当我自己测试时我找不到任何附加标头或标头中的任何附加参数不过当您安排电子邮件时 Gmail 会设置Date标题到预定时间由于您只能以分钟的精
美化C++代码，为条件语句添加括号

如何美化C 代码为条件语句添加括号我需要做的是改变 if myCondition setDateTime date time to if myCondition setDateTime date time 但我必须这样做数百次我用过A
Angularjs 使用 django 的 url 进行路由

我使用 AngularJS 作为前端使用 Django 作为后端我在后端做非常简单的事情所以我没有考虑使用tastypie 我遇到的问题是客户端服务器路由我彻底困惑了我所做的是从django渲染entry html页面其中有
在cmd中重新排列数组元素

我的批处理文件中有一个数组如下所示 port 0 port 1 0 port 2 3 port 3 2 是否有任何漂亮而优雅的方法可以将值向后移动一个元素所以它看起来像这样 port 0 0 port 1 3 port 2 2 port
Caffe 运行测试失败

成功构建 caffe 后我进行了 runtest 但在 ImageDataLayer DBTest DataTransformTest HDF5OutputLayerTest 和一些求解器中失败构建链接到特定路径时是否缺少步骤这是测
Django REST Framework 验证错误：“输入有效的 URL。”

在我的 Django REST Framework 项目中我有一个模型类用于保存 Django 应用程序将在后台任务中抓取的服务 class Service models Model name models CharField max
URL 特定编码

我尝试重新创建 URL 但找不到编码函数 Edit 背景该字符串用于 API 当然没有文档我尝试使用原始网址编码但似乎只有原始的编码解码功能有效所以我必须找到它是什么 input 2 3 word 888 gt word2 AND
CGridView 中的格式化日期过滤器

我在 CGridView 中将日期显示为 22 6 2012 22 53 array name gt date value gt date j n Y G i strtotime model gt date 但在我的过滤器中我需要以这种格
如何在 SQL 中从另一个表获取计数？

我有以下关于 SQL 的表 Mensajes IdMensaje int PK NOT NULL IdCliente int CorreoCliente varchar 100 CorreosAdicionales varchar MAX
将滑动触摸从 UIView 传递到底层 UIScrollView 以实现正确滚动

我的情况与这两篇文章类似 1907297 http www stackoverflow com questions 1907297 AND 689684 http www stackoverflow com questions 689684
NineOldAndroids，旋转或移动后不可点击视图

I use 九老机器人 http nineoldandroids com2 4 0 为对象设置动画主要用于运动和变换的控制在 Android 4 0 及更高版本上一切正常但在以前的版本 2 1 2 3 上动画元素没有获得焦点并且不可
在 Rails 中调试？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案如何在 RubyonRails 中相对成功地调试我知道并广泛使用以下内容 Terminal 导轨控制台开发者工具日志文件生产开发
删除 pandas DataFrame 列中字符串条目的末尾

我有一个 pandas Dataframe 其中一列是文件列表 import pandas as pd df pd read csv fname csv df head filename A B C fn1 txt 2 4 5 fn2 tx

删除 pandas DataFrame 列中字符串条目的末尾

删除 pandas DataFrame 列中字符串条目的末尾 的相关文章

随机推荐

热门标签

删除 pandas DataFrame 列中字符串条目的末尾的相关文章