为什么 Pandas 内连接给出 ValueError: len(left_on) 必须等于“right”索引中的级别数?

2024-05-01

我正在尝试将 DataFrame A 内部连接到 DataFrame B 并且遇到错误。

这是我的加入声明:

merged = DataFrameA.join(DataFrameB, on=['Code','Date'])

这是错误:

ValueError: len(left_on) must equal the number of levels in the index of "right"

我不确定列顺序是否重要(它们并不是真正“有序”的,不是吗?),但为了以防万一,DataFrame 的组织方式如下:

DataFrameA:  Code, Date, ColA, ColB, ColC, ..., ColG, ColH (shape: 80514, 8 - no index)
DataFrameB:  Date, Code, Col1, Col2, Col3, ..., Col15, Col16 (shape: 859, 16 - no index)

我需要更正我的 join 语句吗?或者是否有另一种更好的方法来获取这两个 DataFrame 的交集(或内部联接)?


use merge如果您没有加入索引:

merged = pd.merge(DataFrameA,DataFrameB, on=['Code','Date'])

跟进以下问题:

这是一个可重现的示例:

import pandas as pd
# create some timestamps for date column
i = pd.to_datetime(pd.date_range('20140601',periods=2))

#create two dataframes to merge
df = pd.DataFrame({'code': ['ABC','EFG'], 'date':i,'col1': [10,100]})
df2 = pd.DataFrame({'code': ['ABC','EFG'], 'date':i,'col2': [10,200]})

#merge on columns (default join is inner)
pd.merge(df, df2, on =['code','date'])

这个结果是:

    code    col1    date    col2
0   ABC     10      2014-06-01  10
1   EFG     100     2014-06-02  200

当你运行这段代码时会发生什么?

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 Pandas 内连接给出 ValueError: len(left_on) 必须等于“right”索引中的级别数? 的相关文章

随机推荐