我有一个多年来商店访问的管理数据集,我正在尝试将其合并到ID
多变的。
每个数据集都有一个重复项ID
发生在不同的商店访问期间,注释为Date
。一些较新的数据文件也有新变量(Y
)不包含在旧数据文件中。不同年份的数据集也会包含不同的案例,由不同的案例表示ID
。此外,某些变量对于每种情况可能是相同的,但在不同的日期。我希望合并的文件保留这些重复项。
数据文件示例:
File 1
ID Date X
1 3 4
1 5 3
2 1 4
File 2
ID Date X Y
1 6 4 2
1 7 1 5
2 8 4 7
3 7 2 3
我希望合并的文件继续列出所有重复的案例,如下所示:
ID Date X Y
1 3 4 .
1 5 3 .
1 6 4 2
1 7 1 5
2 1 4 .
2 8 4 7
3 7 2 3
然后我计划重组(CASESTOVARS /AUTOFIX=0
)合并的文件,使其看起来像这样:
ID Date.1 Date.2 Date.3 Date.4 X.1 X.2 X.3 X.4 Y.1 Y.2 Y.3 Y.4
1 3 5 6 7 4 3 4 1 . . 2 5
2 1 8 . . 4 4 . . . 7 . .
3 7 . . . 2 . . . 3 . . .
然而,我在最初的合并过程中遇到了麻烦。当文件都有重复的情况时,我尝试查找合并文件的最安全方法,以确保在此过程中不会丢失数据。似乎“添加变量”方法会导致重复变量的值丢失。
Thanks!
编辑:如果我使用“添加变量”功能并使用ID
and Date
变量作为关键变量,这是否有助于避免删除重复的案例?
为什么不尝试一下add cases
代替add variables
?如果没有出现相同日期的相同 ID,则应该可以正常使用casestovars
.
如果存在此类情况,您需要先考虑如何处理它们,然后才能继续处理casestovars
.
一种方法是按 ID 和 DATE 进行聚合,然后决定是否要例如将本例的数据变量相加。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)