假设现在我有一个dataframe
有 2 列:州和城市。
然后我有一个单独的dict
每个州的两个字母的缩写。现在我想添加第三列来映射州名称及其两个字母的缩写。我应该在 Python/Pandas 中做什么?例如示例问题如下:
import pandas as pd
a = pd.Series({'State': 'Ohio', 'City':'Cleveland'})
b = pd.Series({'State':'Illinois', 'City':'Chicago'})
c = pd.Series({'State':'Illinois', 'City':'Naperville'})
d = pd.Series({'State': 'Ohio', 'City':'Columbus'})
e = pd.Series({'State': 'Texas', 'City': 'Houston'})
f = pd.Series({'State': 'California', 'City': 'Los Angeles'})
g = pd.Series({'State': 'California', 'City': 'San Diego'})
state_city = pd.DataFrame([a,b,c,d,e,f,g])
state_2 = {'OH': 'Ohio','IL': 'Illinois','CA': 'California','TX': 'Texas'}
现在我必须将 State 列映射到df
state_city
使用字典state_2
。映射的df
state_city
应包含三列:state
, city
, and state_2letter
.
我的原始数据集包含几乎所有美国主要城市的多个列。
因此,手动执行的效率会较低。有什么简单的方法可以做到吗?