这是后续如何对制表符分隔的数据文件中的列值进行平均,忽略标题行和左列? https://stackoverflow.com/questions/9677533/how-do-i-average-column-values-from-a-tab-separated-data-file-ignoring-a-header。任务是:打开并读取文件;到达每一行,将内容分成一个数组,并计算数值的平均值;最后将包含数值的每列的平均值写入新文件。
直到最后一刻,一切似乎都很顺利。问题是,虽然我可以创建一个新的.txt
文件,该.txt
文件本身没有输出中打印的内容。最好,作为 Perl 的新用户,我更愿意将脚本保留在下面编写的样式中,以便我可以更好地理解它。我不太喜欢可能存在的更简洁的版本。谢谢jchips12 https://stackoverflow.com/users/882628/jchips12因为非常有帮助。
无论如何,代码是:
#!/usr/bin/perl -w
use strict;
my $infile = "Lab1_table.txt"; # This is the file path
open INFILE, $infile or die "Can't open $infile: $!";
my $outfile = "Lab1_tableoutput.txt";
open OUTFILE, ">$outfile" or die "Cannot open $outfile: $!";
my $count = 0;
my @header = ();
my @average = ();
while (<INFILE>) {
chomp;
my @columns = split /\t/;
$count++;
if ( $count == 1 ) {
@header = @columns;
} else {
for( my $i = 1; $i < scalar @columns; $i++ ) {
$average[$i] += $columns[$i];
}
}
}
for( my $i = 1; $i < scalar @average; $i++ ) {
print $average[$i]/($count-1), "\n";
}
print OUTFILE "\n";
close OUTFILE;
数据来自文件Lab1_table.txt
如下:
retrovirus genome gag pol env
HIV-1 9181 1503 3006 2571
FIV 9474 1353 2993 2571
KoRV 8431 1566 3384 1980
GaLV 8088 1563 3498 2058
PERV 8072 1560 3621 1532
结果产生了正确的平均值,尽管在终端中有点混乱,并且它们没有对应于任何列号/名称进行标记。也.txt
文件已生成,但没有输出。
结果如下:
Argument "" isn't numeric in addition (+) at line 25, <INFILE> line X
0
8649.2
1509
3300.4
2142.4
***Line X: Where X is either 2, 3, 4, 5, or 6.***
由此我可以推断“参数”错误指的是 5 个标题列,并且0
到唯一具有非数字值的列。
帮助将文件写入.txt
文件,或者以某种方式我可以读取命令行中所示的输出,将不胜感激。另外,虽然我模糊地知道代码的每个步骤发生了什么,但如果可能的话,我希望能更深入地了解大多数步骤中发生的情况。我仍在阅读它,但我希望能够清楚地理解更多细节。