我正在将 .csv 文件读入 pandas 数据帧。 .csv 文件包含多个列。列“A”包含字符串“20-989-98766”。加载文件时是否可以只读取字符串的最后 5 个字符“98766”?
df = pd.read_csv("test_data2.csv", column={'A':read the last 5 characters})
output:
A
98766
95476
.....
您可以定义一个func
并将其作为参数传递给converters
参数为read_csv:
In [57]:
import io
import pandas as pd
def func(x):
return x[-5:]
t="""column
'20-989-98766"""
df = pd.read_csv(io.StringIO(t), converters={'column': func})
df
Out[57]:
column
0 98766
所以这里我定义了一个func
并将其传递给converters
以字典的形式,以您的列名作为键,这将调用func
在 csv 中的每一行
所以在你的情况下,以下应该有效:
df = pd.read_csv("test_data2.csv", converters={'A':func})
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)