在 Perl 中，参考文件和一系列文件之间的映射

2024-01-04

我想在 Perl 中映射两个数据集。我有一个不变的数据集（ref 1），必须从一系列文件（1-20）中提取其他数据以匹配 ref1。

Ref1
ID1    ID2
1       HZ
1       HX
1       HY
2       C  
2       HZ
2       N

File 1
ID2    ID3
HA      5 
HB      4
HC      7
N       2

File 2
ID2    ID3
C      9
HZ     11
N      0

理想输出：

ID1 ID2 ID3 
1   HZ   5
1   HX   4 
1   HY   7
2   C    9
2   HZ   11
2   N    0

匹配发生在 ref1 中 ID2 的第一个字母与 file1 中 ID2 的第一个字母之间，直到完成所有 ID1 条目的匹配，然后打开 file2 并与所有编号为 2 的 ID1 进行匹配。文件名的格式为 number001.txt 、number002.txt等，因此可以从文件名中检索ID1。

我希望这是有道理的。我是 Perl 的初学者，这是我到目前为止所拥有的：

#!/usr/bin/perl
use strict;
use warnings;

my $ref1 = 'test.txt';
my $input_path = '/path/';

open my $fh, '<' $ref1 or die "Can't read $ref1: $!";
chomp (my @ref1 = <$fh>);

my %hash = @ref1;

my @filehandles;
for ($i=0; $i<20, $i++) {
    local *FILE;
    open(FILE, ">number$i.txt") or die $!;
    push(@filehandles, *FILE);
}

任何建议都会非常有帮助。

这并没有按照您的想法进行：

chomp (my @ref1 = <$fh>);
my %hash = @ref1;

在这里转置键/值并没有什么魔力——所以你要做的就是得到一个如下所示的哈希值：

      '2       C  ' => '2       HZ',
      'ID1    ID2' => '1       HZ',
      '1       HX' => '1       HY',
      '2       N' => undef

我打赌那不是你想要的。

我怀疑你可能想要的是：

    my %ref1;
    while ( <$input> ) {
        chomp;
        my ( $key, $value ) = split;
        push ( @{$ref1{$key}}, $value );
    }
    print Dumper \%ref1;

您还将打开文件以便在第二个循环中进行写入。您可能也不想这样做。

我会选择类似的东西：

#!/usr/bin/perl
use strict;
use warnings;

use Data::Dumper;

my $ref1       = 'ref1.txt';
my $input_path = '/path/';

open my $ref1_fh, '<', $ref1 or die "Can't read $ref1: $!";

my %ref1;
while (<$ref1_fh>) {
    chomp;
    next if m/ID/;
    my ( $key, $value ) = split;
    my $zeropadded = sprintf( "%03d", $key );
    my ($firstletter) = ( $value =~ m/^(\w)/ );
    push( @{ $ref1{$zeropadded}{$firstletter} }, $value );

}

print Dumper \%ref1;

print join( "\t", "ID1", "ID2", "ID3" ), "\n";
foreach my $filename ( glob("number*.txt") ) {
    my ($ref_num) = ( $filename =~ m/number(\d+)/ );
    open( my $input, "<", $filename ) or warn $!;
    while (<$input>) {
        chomp;
        my ( $key, $value ) = split;
        my ($firstletter) = ( $key =~ m/^(\w)/ );
        if ( defined $ref1{$ref_num}{$firstletter}
            and @{ $ref1{$ref_num}{$firstletter} } )
        {
            my $refkey = pop( @{ $ref1{$ref_num}{$firstletter} } );

            print join( "\t", int $ref_num, $refkey, $value ), "\n";
        }
    }
    close($input);
}

我已将“ref”数字转换为零填充，因此它直接匹配文件名，因为您指定的文件名是number001.txt匹配1 in ref1.

我还要插入以下内容$ref1进入数组的哈希值，键入您要查找的第一个字母 - 弹出“查找”值直到为空。

因此我们得到：

ID1 ID2 ID3
1   HY  5
1   HX  4
1   HZ  7
2   C   9
2   HZ  11
2   N   0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

perl

在 Perl 中，参考文件和一系列文件之间的映射的相关文章

如何使用 Perl 正则表达式匹配字符串末尾/开头处的空格或单词？

我想找到与我的正则表达式匹配的序列它们应该位于由空格包围的字符串中间末尾或开头或者是字符串中唯一的东西 Example 我们假设序列 qwe45rty 就是我们正在寻找的我希望能够对所有这些因素都抱有积极的态度 qwe45rty qw
如何轻松地将 Ajax、perl 和 JSON 结合使用？

我正在尝试使用 Ajax 制作一个网页 Example 我创建了一个 Perl CGU 文件来触发一个简单的帖子文件 test cgi name 托马斯回复短信你的名字是托马斯我创建了一个可以使用该帖子的 html 文件但随后页面
在 Ubuntu 中执行 .cgi 文件

我在 Ubuntu 下运行 Apache PHP 当我运行 cgi 文件时通过http localhost mycgi cgi 浏览器将显示代码而不是运行它如何让浏览器执行 CGI 文件而不是显示其内容将这些行添加到您的 apache
如何对 Data::Dumper 的输出进行排序？

我想转储对象和散列的值但它总是乱序打印键如何按递归排序顺序转储键 use Data Dumper print Dumper obj Set Data Dumper Sortkeys 1获取 Perl 的默认排序顺序如果要自定义顺序
Perl Parallel::Forkmanager 不允许收集变量值

也许因为子进程不知道我的散列请参阅下面的代码散列输出没有收集任何内容除了写入 tmp 文件之外还有其他方法来收集该值吗 foreach Item AllItems pid pm gt start Item and next Tem
在 qx 运算符中将 perl 数组拆分为单独的参数

我试图将一组参数传递给qx操作员考虑 my files qw A txt B txt print qx ls files 这给出了错误 ls cannot access A txt B txt No such file or direct
使用 -T 开关运行时 $ENV{ENV} 不安全

当我尝试最后一个例子时perlfaq5 如何计算文件中的行数 http perldoc perl org perlfaq5 html How do I count the number of lines in a file 我收到一条错误消
无法从日志文件中提取特定信息

我这里有日志文件我想提取以下信息想要提取十六进制值如果该行有第二个括号 0 9 想要提取十进制值首先转换为十六进制然后提取 9 gt 0x09 想要提取负值 25 先转换为十六进制然后提取例如 25 gt FFE7 gt 想要提取
为什么我的 Apache2::Log 输出用 \n 替换换行符？

我在 apache2 mod perl 下设置了多个虚拟主机我用的是ErrorLog指令为每个虚拟主机获取单独的错误日志仅当我使用 Apache2 Log 时这才按预期工作警告只会记录到常规错误日志中这样就可以了最后但还存在
Perl：正则表达式不抓取代码中的多行 C 风格注释

我有一个 Perl 程序读取用 C 编写的 SRC 文件使用 SRC 文件中的正则表达式匹配来查找特定格式的数据以用作目标文件名打开新的目标文件执行另一个正则表达式匹配以查找包含关键字 abcd 的所有 C 风格注释注意这些注释
如何忽略 perl 中的“证书验证失败”错误？

我想访问一个无法验证证书的网站我正在使用 WWW Mechanize 获取请求那么如何忽略这一点并继续连接到该网站呢 use IO Socket SSL qw use WWW Mechanize qw my mech WWW Mecha
从具有多行记录的文件中提取数据，将每个范围保存到单独的文件中

我有一个看起来像这样的文件 TRANSACTION STARTED 020t CARD INSERTED 020tCARD 5845 DATE 01 02 16 TIME 05 45 52 05 46 26 GENAC 1 ARQC EXT
perl 和 java 正则表达式功能之间有什么区别？

perl 和 java 在支持哪些正则表达式术语方面有什么区别这个问题仅涉及正则表达式并且特别排除了how可以使用正则表达式即使用正则表达式的可用函数方法以及语言之间的语法差异例如java要求转义反斜杠等特别令人感兴趣的是 j
Perl 脚本中“不在某个 shell 下运行”是什么意思？

在许多 Perl 脚本中特别是在著名的 CPAN 发行版中我发现以下代码 eval exec usr bin perl w S 0 1 if 0 not running under some shell 我想知道它是做什么用的 Than
与 6 位随机字母数字代码发生冲突的概率是多少？

我使用以下 Perl 代码生成随机字母数字字符串仅限大写字母和数字用作 MySQL 数据库中记录的唯一标识符数据库的行数可能会保持在 1 000 000 行以下但实际的绝对最大值约为 3 000 000 行我是否有 2 条记录具有
为什么 getElementsByTagName 会出现“无效谓词”错误？

我有以下 XML
在哪里可以找到将现有 CPAN 模块转换为使用 Dist::Zilla 的简明指南？

我曾多次阅读过相关文档和一些博客文章地区齐拉 http search cpan org dist Dist Zilla 我从来没有对自己的理解充满信心在回答另一个问题时 Ether 提出了转换的可能性地穴 SSLeay http sea
如何通过 sudo （或作为另一个用户）打开 Perl 文件句柄写入数据

我想将数据写入文件但应使用特定用户的访问权限打开文件句柄因此有以下声明 open FH gt filename or die n 将允许以该特定用户的身份写入文件有没有办法在 Perl 脚本中执行此操作而无需运行整个脚本sudo
Perl：管理 Windows 上的路径编码

我正在努力处理包含非英文字符的路径 Activestate Perl Windows XP 如何打开写入复制等位于包含希腊语俄语法语重音字符的路径中的文件假设我要将 text txt 文件复制到的目录是 C Documents a
使用perl创建层次结构文件

我的任务是使用 perl 创建父子层次结构文件示例输入文件制表符分隔记录将以随机顺序排列在文件中父项可能出现在子项之后 S5 S3 S5 S8 ROOT S1 S1 S7 S2 S5 S3 S4 S1 S2 S4 77 S2

随机推荐

为什么在这种情况下会生成classname$1.class？ [复制]

这个问题在这里已经有答案了我编写了以下代码来实现单例模式 public final class Test static final class TestHolder private static final Test INSTANCE n
SQL 检查列中的所有值

我在 Oracle DB 中有下表 ID VALUE 1 1 1 2 1 3 2 1 2 2 3 1 3 2 3 3 4 1 如何选择具有全部 3 个值 1 2 3 的 ID 最简单的选择通常是这样的 SQL gt ed Wrote fil
如何将数组写入nodejs中的文件并保留方括号？

我想将矩阵写入 js 文件当我使用 console log matrix 时一切都很好但是当我将其写入文件时结果会有所不同 var fs require fs var matrix new Array 10 for var i 0
在 Angularjs 中对基于 Promise 的代码进行单元测试

我在尝试在 Angularjs 中测试基于 Promise 的代码时遇到了困难我的控制器中有以下代码 scope markAsDone function taskId tasksService removeAndGetNext taskI
重命名列正则表达式，如果不匹配则保留名称

data First Column 1 2 3 Second Column 1 2 3 First Mid LAST Ending 1 2 3 First1 Mid1 LAST1 Ending 1 2 3 df pd DataFrame d
Doctrine 部分查询返回完整对象

我正在尝试优化查询因为我需要一个简单的列表作为附属于多个实体的实体所以我创建了这个查询你应该给我返回 id 和名称 public function findAllOrderByName qb this gt createQueryBu
更改主题，例如 Fabric Web（默认/深色）

在fabric的文档页面中现在每个示例组件都有更改主题功能 IE example https developer microsoft com en us fabric controls web button 在此输入图像描述 https
Linux内核中的内存屏障是如何使用的

内核源码Documentation memory barriers txt中有一个说明如下所示 CPU 1 CPU 2 B 7 X 9 Y 8 C Y STORE A 1 STORE B 2
Microsoft Bot Framework DirectLine 无法访问对话

我正在尝试使用 Microsoft Bot Framework DirectLine API 读取消息并将其添加到其他用户和我的机器人之间的现有对话中根据我所读到的内容我相信使用主秘密时这应该是可能的但它对我不起作用我正在使用 We
即使有事务，SQLite 插入也会变慢

即使对于事务我也遇到了 sqlite 插入性能的问题我的 Android 应用程序从 Web 服务接收大约 23 000 行我必须将它们插入到单个表中 Web 服务已分区以便我在对 WS 的每个请求中收到大约 2000 行并将这
完整句子的反义词

我想以相反的格式打印字符串 Input My name is Archit Patel Output Patel Archit is name My 我已经绑定了以下内容但它显示为letaP tihcrA si eman ym publi
将所有匹配项收集到一个单元格中的电子表格公式

我有一个电子表格如下所示 A B C D FirstName SurnameName Address UniqueFamilyId Abe Black 1 Elm Ave Black 1 Elm Ave Joe Doe 7 Park Ln
iOS/Xcode 为项目中的框架启用按需资源

有没有人建立过一个项目Enable On Demand Resources set to YES用于与该项目相关的框架我正在开发的应用程序中的大多数目录资源都被保留并带入框架中的项目中并且出现构建错误Target
将 Gstreamer 与 Qt 连接以便在 Qt Widget 中播放 gstreamer 视频

我尝试使用声子播放视频但无法成功 Off late通过Qt论坛了解到即使是最新版本的Qt也不支持phonon 就在那时我开始使用 Gstreamer 关于如何将 Gstreamer 窗口与 Qt 小部件连接有什么建议吗我的目标是在 Qt
将 Django 数据库后端从 MySql 更改为 PostgreSQL

我使用 Django 1 2 和 1 3 以及 MySql 后端使用 South 迁移 MySql 数据库时偶尔会收到一条错误消息 Error found during real run of migration Aborting Sin
将项目（jar）导入Eclipse

我有一个 jar 文件需要将其导入到 Eclipse 中但是我不想将该 jar 作为引用的库我需要像普通项目一样包含 jar 其中包含包和 java 文件我尝试执行以下操作新建 Java 项目 gt 导入 gt 常规 gt
Application_Error - GetLastError() 或 GetLastError().GetBaseException()

处理错误时Application Error 我应该使用这两个中的哪一个我找到了两者的多个例子但并不清楚一个是否比另一个更好是否存在只有一个会显示正确错误的情况另外我怀疑这很重要但该应用程序正在使用 MVC 4 这取决于您到底需
在 Eclipse 项目资源管理器上下文菜单中的“项目”上方添加项目

我正在为我们的开发环境开发一个基于 eclipse 的定制 IDE 在我的新视角中我包含了一个项目资源管理器并且我能够在上下文菜单中添加命令但是当我在新类型中包含一个新向导项目向导时它会显示在项目向导我希望它位于它之
IIS：如何使用 Microsoft.Web.Administration 在网站中创建虚拟目录

我正在寻找一种在默认网站中使用 Microsoft Web Administration 创建虚拟目录但不创建应用程序的方法我发现的唯一方法是创建应用程序 Microsoft Web Administration ServerManage
在 Perl 中，参考文件和一系列文件之间的映射

我想在 Perl 中映射两个数据集我有一个不变的数据集 ref 1 必须从一系列文件 1 20 中提取其他数据以匹配 ref1 Ref1 ID1 ID2 1 HZ 1 HX 1 HY 2 C 2 HZ 2 N File 1 ID2 ID3

在 Perl 中，参考文件和一系列文件之间的映射

在 Perl 中，参考文件和一系列文件之间的映射 的相关文章

随机推荐

热门标签

在 Perl 中，参考文件和一系列文件之间的映射的相关文章