- 我有一个 250MB 以上的巨大 csv 文件要上传
- 文件格式是
group_id, application_id, reading
数据可能看起来像
1, a1, 0.1
1, a1, 0.2
1, a1, 0.4
1, a1, 0.3
1, a1, 0.0
1, a1, 0.9
2, b1, 0.1
2, b1, 0.2
2, b1, 0.4
2, b1, 0.3
2, b1, 0.0
2, b1, 0.9
.....
n, x, 0.3(lets say)
- 我想根据
group_id
,所以输出应该是 n 个文件,其中n=group_id
Output
File 1
1, a1, 0.1
1, a1, 0.2
1, a1, 0.4
1, a1, 0.3
1, a1, 0.0
1, a1, 0.9
and
File2
2, b1, 0.1
2, b1, 0.2
2, b1, 0.4
2, b1, 0.3
2, b1, 0.0
2, b1, 0.9
.....
and
File n
n, x, 0.3(lets say)
我怎样才能有效地做到这一点?