使用 Perl 计算字符串中的连续字符数

2024-05-10

我有一个包含多个连续字符序列的字符串，例如：

aaabbcccdddd

我想将其表示为：a3b2c3d4

到目前为止，我已经想出了这个：

#! /usr/bin/perl

$str = "aaabbcccdddd";
$str =~ s/(.)\1+/$1/g;

print $str."\n";

Output:

abcd

它将连续的字符存储在捕获缓冲区中并仅返回一个。但是，我想要一种方法来计算捕获缓冲区中的连续字符数，然后仅显示一个字符，后跟该计数，以便将输出显示为a3b2c3d4代替abcd.

上述正则表达式需要进行哪些修改？

这似乎需要替换命令上的“执行”选项，因此替换文本被视为 Perl 代码的片段：

 $str =~ s/((.)\2+)/$2 . length($1)/ge;

Script

#!/usr/bin/env perl
use strict;
use warnings;

my $original = "aaabbcccdddd";
my $alternative = "aaabbcccddddeffghhhhhhhhhhhh";

sub proc1
{
    my($str) = @_;
    $str =~ s/(.)\1+/$1/g;
    print "$str\n";
}

proc1 $original;
proc1 $alternative;

sub proc2
{
    my($str) = @_;
    $str =~ s/((.)\2+)/$2 . length($1)/ge;
    print "$str\n";
}

proc2 $original;
proc2 $alternative;

Output

abcd
abcdefgh
a3b2c3d4
a3b2c3d4ef2gh12

您能分解一下正则表达式来解释它是如何工作的吗？

我假设是匹配部件有问题，而不是替换部件。

原来的正则表达式是：

(.)\1+

这捕获单个字符(.)其后是重复一次或多次的相同字符。

修改后的正则表达式是“相同的”，但也捕获了整个模式：

((.)\2+)

第一个左括号开始整体捕获；第二个左括号开始捕获单个字符。但是，现在是第二次捕获，所以\1在原来的需要变成\2在修订中。

由于搜索捕获整个重复字符字符串，因此替换可以轻松确定模式的长度。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

perl

使用 Perl 计算字符串中的连续字符数的相关文章

在 Perl 中如何打印到变量而不是文件？

如何使用 Perl 打印到变量我已经在一个程序上工作了一段时间它记录了它的迭代的以非常详细的方式取得进展 print loghandle some message 但是我还想有选择地将一些消息打印到不同的文件中当然我可以在代码中添
正则表达式 - 剥离非数字并删除分（如果有）

我目前正在开发一个 PHP 项目需要一些正则表达式的帮助我希望能够获取用户输入的货币值并删除所有非数字和小数位分 Ex 2 000 00 到 2000 2 000 00 美元到 2000 2abc000 到 2000 2 000 到
正则表达式提取大括号之间的文本

我正在尝试提取 PHP 中花括号之间的文本例如欢迎 user first name 使用 site 版本 1 5 您的用户名是 user username 您目前的声誉是 user reputation name 我用过在某些情况下
用于替换前 5 个数字的正则表达式，无论它们之间有什么？

我正在努力实现以下匹配 Input 123 45 6789 123456789 1234 正则表达式尝试输出 d 5 123 45 6789 123456789 1234 d 2 3 123 45 6789 123456789 1234 d
不允许连续点的正则表达式

我有一个正则表达式允许字母数字下划线和点但不允许连续点 2 a zA Z0 9 我现在还需要允许在字符串的第一个和最后一个字符中使用点我怎样才能做到这一点您可以像这样使用它和额外的前瞻 a zA Z0 9 不允许开始时不允许有
如何只读取文件的第一行

我已经用谷歌搜索了一段时间但我找不到只读取文件第一行的函数我需要读取文本文件的第一行并从中提取日期 Perl 新手 open my file lt filename txt my firstLine lt file gt close f
当 sleep() 不能与闹钟配合使用时，我还能做什么“睡眠”？

有许多文档说您应该避免使用带有警报的睡眠因为许多系统使用警报来实现睡眠事实上我正在遭受这个问题的困扰那么当 sleep 无法与闹钟配合使用时有人可以帮助我我还能做什么睡眠吗我已经尝试过 Time HiRes 模块的 u
正则表达式 - 避免表达式中出现字符串

我正在尝试创建一个应该匹配以下情况的正则表达式如果单词完全匹配 first second third 那么匹配应该失败但如果它周围有任何字符那么应该匹配该字符串我还需要避免字符串中的某些字符集如果这些字符是字符串的一部分则匹配结
xpath+ 正则表达式：匹配文本

我正在尝试编写一个 xpath 以便仅返回包含文本和数字的节点我想使用正则表达式并希望这能起作用 td matches text d 谁能帮我理解我在这里做错了什么 tr td 1 td td 10 td td a td tr 你缺少量化
R正则表达式获取第二个下划线之前的所有文本

s lt 1 343 43Hello 2 323 14 fdh 99H 在 R 中我想使用正则表达式来获取第二个下划线之前的子字符串如何使用一个正则表达式来完成此操作另一种方法是用分割然后粘贴前两个一些东西 paste sapp
是否有与 pdl2（或 Devel::REPL）中的 perl 调试器“x”等效的东西？

我在用pdl2 the PDL http p3rl org PDLshell 也作为我的默认 Perl 交互式 shell 它加载所有不错的插件Devel REPL http search cpan org perldoc Devel 3a
Notepad++:: 通过正则表达式完全删除包含问号的行

嗯我想这就是我的标题这对于我将要实现的目标来说是不言自明的这是我当前的文本文件的示例 Diva was the winning song of the Eurovision Song Contest 1998 Who will win
使用“严格引用”时不能使用字符串作为 ARRAY 引用

我正在尝试执行下面提到的代码并观察到错误在使用严格引用时无法使用字符串 RCSoWLAN ePDG 2 Qguest ASUS ATT 作为 ARRAY 引用 Perl代码 perl64 bin perl use strict us
PCRE 匹配 C 中的所有组

我想使用 PCRE C 库递归地匹配一个组 e g pattern d subject 5 6 3 2 OVECCOUNT 30 pcrePtr pcre compile pattern 0 error erroffset NULL rc
C#中如何从字符串中提取十进制数

string sentence X10 cats Y20 dogs 40 fish and 1 programmer string digits Regex Split sentence D 对于此代码我在数字数组中获取这些值 10 20
带变量的 AWK 负正则表达式

我在 bash 脚本中使用 awk 来比较两个文件以获取不匹配的行我需要将第二个文件的所有三个字段作为一个模式与第一个文件的所有行进行比较第一个文件 chr1 9997 10330 HumanGM18558 peak 1 150 1
C# 验证用户输入（如信用卡号）

这是为了一个任务我需要为三明治店创建一个程序其中一部分是验证用户的付款信息本次作业的指导方针是信用卡号码必须为16位数字前 4 位数字必须是以下数字之一 1298 1267 4512 4567 8901 8933 到期日期必须为
PHP正则表达式替换链接url

我需要添加href 之前http 如果这http 不遵循href or src 以下代码部分有效部分意味着它考虑 a href 只但不src a s i a href target blank gt 0 a str 预先感谢各位的回复 s
解析格式化字符串

我正在尝试创建一个通用格式化程序解析器组合示例场景我有一个 string Format 的字符串例如var format 0 1 我有一个用于输入的对象字符串数组例如var arr new asdf qwer 我正在使用格式字
在 Perl 中查找数组的大小

我似乎遇到过几种不同的方法来查找数组的大小这三种方法有什么区别呢 my arr 2 print scalar arr First way to print array size print arr Second way to print

随机推荐

如何在WCF Rest服务中从流上传图像

我正在尝试创建 wcf 服务该服务将上传 pdf doc xls 图像等文件但 pdf txt 文件正在上传并正确打开但是当我尝试上传图像文件时文件正在上传但是图像不可见 OperationContract WebInvoke M
Windows Azure 网站 - 获取实例标识符

在具有多个实例的 Azure 网站上确定哪个实例正在响应某些 ID 或其他唯一信息的可能方法是什么以下环境设置将包含当前请求正在其上运行的实例 ID WEBSITE INSTANCE ID 您还将在响应中收到此 id 作为 cooki
当我没有指定 x64 平台而不是 AnyCPU 时，MSBuild 如何或为何选择 x64 平台？

我在跑msbuild exe通过常规 PowerShell 控制台的 Rake 这是从诊断级别运行打印的命令 C Windows Microsoft NET Framework v4 0 30319 msbuild exe D Projec
如何像在浏览器中一样检索准确的 HTML

我正在使用 Python 脚本来呈现网页并检索其 HTML 它适用于大多数页面但对于其中一些页面检索到的 HTML 不完整我不太明白为什么这是我用来废弃此页面的脚本由于某种原因每个产品的链接不在 HTML 中 Link http
使用 prawnto_2 gem 加载图像时，RAILS_ROOT 不再有效

我正在将我的应用程序从 Rails 3 0 升级到 Rails 3 1 我已经尽可能地将旧插件转为 gems 其中包括用这个漂亮闪亮的新插件替换旧的 prawnto 插件对虾 2 https github com forrest prawn
为基于架构的 XML 文件创建 WPF 编辑器

这是场景我们的服务器产品之一使用大型 XML 配置文件该文件的布局相当好并且针对 XSD 文件进行了验证现在是时候构建一个配置 GUI 来维护这个文件了我想深入研究 WPF 来完成它我可以为每个配置部分布置一个单独的表单每次向
ExtJS 4.1：如何将本地数据与 ajax 加载的数据合并到单个存储中？

我正在寻找一种将本地数据与 ajax 加载的数据组合到单个存储中的方法我很难用英语解释这一点我希望这段代码能更明确 var store Ext create Ext data Store autoLoad true fields id
如何链接到具有特定经度和纬度的 Google 地图？

我有一个小应用程序可以提供当前位置经度和纬度现在我必须浏览带有经度和纬度的谷歌地图请建议我如何做到这一点最好的方法是使用q参数以便显示带有标记点的地图例如 https maps google com q
向 tk103 GPS 跟踪器发送命令

我正在使用 php 开发实时 GPS 跟踪器 Web 应用程序跟踪器参考号是tk103 我可以从跟踪器接收信息并将其存储到数据库中设备的 GPRS 模式已启用我的问题是如何使用 php ini 将命令从服务器发送到设备提前致谢这
C# 中输入按键

我尝试了这段代码 private void textBox1 KeyPress object sender KeyPressEventArgs e if Convert ToInt32 e KeyChar 13 MessageBox Sho
这种对有效类型规则的使用是否严格遵守？

C99和C11中的有效类型规则规定没有声明类型的存储可以用任何类型写入并且存储非字符类型的值将相应地设置存储的有效类型抛开 INT MAX 可能小于 123456789 的事实不谈以下代码对有效类型规则的使用是否严格符合 inclu
如何使用 AutoLayout 使 UIView 向上滑动动画？

this is what I like to achieve 我想执行向上滑动动画用户可以向上滑动 UIView2 并且 UIView2 将在屏幕上停止一半我知道如何通过 UIButton 操作以模态方式呈现 UIViewControl
仅使用 CSS 向电话号码添加空格

我有一个生成 HTML 电话号码的页面如下所示 div class phone 01987123456 div 我想要的只是在数字内添加一个空格如下所示 01987 123456 生成的数字和 HTML 始终相同但我只能访问客户端代码
如何将 mat 转换为 array2d？

我为dlib http dlib net face landmark detection ex cpp html那里的面部地标代码使用 array2d 来获取图像但我喜欢使用 Mat 读取图像并转换为 array2d 因为 dlib 仅支
弹出 x86 堆栈以访问函数 arg 时出现分段错误

我正在尝试链接 x86 程序集和 C 我的C程序 extern int plus 10 int include
从 bash 脚本运行节点

很简单我正在尝试使用 cron 自动运行 nodejs 脚本但是脚本本身似乎无法运行该文件我的脚本很简单 usr bin env node node var node assets js update js 但是在运行此命令时它返
ASP Readline 非标准行结尾

我正在使用 ASP 经典版ReadLine 文件系统对象的功能一切都进展顺利直到有人在 Mac 上使用 TextEdit 制作了导入文件行结尾不相同并且ReadLine 读入整个文件而不是一次只读一行有处理这个问题的标准方法吗
如何在特定天数限制后从温斯顿日志中删除文件？

我正在使用winston将文件记录到按预期工作的服务器中现在我想设置天数限制假设3天后我想删除3天前记录的文件是否可以使用winston轮换来实现 main js winston add winston transports File
如何进行Visual Studio格式字典初始化？

所有 Visual Studio 也包括 2012 不格式化以下内容 messageProcessor new Dictionary
使用 Perl 计算字符串中的连续字符数

我有一个包含多个连续字符序列的字符串例如 aaabbcccdddd 我想将其表示为 a3b2c3d4 到目前为止我已经想出了这个 usr bin perl str aaabbcccdddd str s 1 1 g print str n

使用 Perl 计算字符串中的连续字符数

Script

Output

使用 Perl 计算字符串中的连续字符数 的相关文章

随机推荐

热门标签

使用 Perl 计算字符串中的连续字符数的相关文章