我有一系列特定的数据集,其一般形式如下:
import pandas as pd
import random
df = pd.DataFrame({'n': random.sample(xrange(1000), 3), 't0':['a', 'b', 'c'], 't1':['d','e','f'], 't2':['g','h','i'], 't3':['i','j', 'k']})
的数量tn列 (t0、t1、t2 ... tn) 因数据集而异,但始终tn每行的列,以便我实现此结果(请注意,为了可读性,我需要保留元素之间的空格):
df['result'] = df.t0 +' '+df.t1+' '+df.t2+' '+ df.t3
到目前为止,一切都很好。这段代码可能很简单,但一旦我收到另一个数据集,它就会变得笨拙和不灵活,其中的数量tn列上升。这就是我的问题所在:
是否有其他语法可以跨多列合并内容?与数字列无关的东西,类似于:
df['result'] = ' '.join(df.ix[:,1:])
基本上,我想实现与下面链接中的OP相同的效果,但字符串之间有空格:在数据帧的特定列之间按行连接 https://stackoverflow.com/questions/6308933/r-concatenate-row-wise-across-specific-columns-of-dataframe