也许这是错误的地方,但我不太确定该把它放在哪里。
我有一个非常大的 .XPT 格式的压缩 SAS 文件。我想将其转换为逗号分隔的格式。该文件太大,无法在 R 中加载。我的机器上没有 SAS,也没有任何方法获取它。
有什么建议么?某处有转换器吗?我无法使用谷歌找到一个。
如果你可以使用Python,我刚刚发布了图书馆 http://pypi.python.org/pypi/xport这可能会有所帮助。转储到 CSV 看起来像这样(未经测试):
import xport, csv with xport.XportReader('in.xpt') as reader: with open('out.csv', 'rb') as out: writer = csv.DictWriter(out, [f['name'] for f in reader.fields]) for row in reader: writer.writerow(row)
文件被视为流,因此文件有多大并不重要(只要您不调用 reader.record_count(),它必须查找文件末尾)。
如果您尝试这样做,请告诉我 - 该库对我有用,但我还没有在许多 .xpt 文件上尝试过。