我有一堆 CSV 文件,我试图将它们连接成一个 csv 文件。 CSV 文件由一个空格分隔,如下所示:
'initial', 'pos', 'orientation', 'ratio'
'chr', '106681', '+', '0.06'
'chr', '106681', '+', '0.88'
'chr', '106681', '+', '0.01'
'chr', '106681', '+', '0.02'
正如您所看到的,除了ratio
。我创建的串联文件将如下所示:
'filename','initial', 'pos', 'orientation', 'ratio1','ratio2','ratio3'
'jon' , 'chr', '106681', '+', '0.06' , '0.88' ,'0.01'
所以基本上,我会遍历每个文件,只存储一个值initial
, pos
, orientation
但所有的值ratio
并更新串联文件中的表。事实证明,这比我想象的要混乱得多。我有以下代码来读取 csv 文件:
concatenated_file = open('josh.csv', "rb")
reader = csv.reader(concatenated_file)
for row in reader:
print row
这使:
['chrom', 'pos', 'strand', 'meth_ratio']
['chr2', '106681786', '+', '0.06']
['chr2', '106681796', '+', '0.88']
['chr2', '106681830', '+', '0.01']
['chr2', '106681842', '+', '0.02']
如果有人能告诉我如何只存储一个值,那将非常有帮助initial
, pos
, orientation
(因为它们保持不变)但是所有的值ratio