我有一个很大的单词列表文件,每行一个单词。我想过滤掉重复字母的单词。
INPUT:
abducts
abe
abeam
abel
abele
OUTPUT:
abducts
abe
abel
我想使用正则表达式(grep 或 perl 或 python)来做到这一点。那可能吗?
编写匹配单词的正则表达式要容易得多do有重复的字母,然后否定匹配:
my @input = qw(abducts abe abeam abel abele);
my @output = grep { not /(\w).*\1/ } @input;
(此代码假设@input
每个条目包含一个单词。)但是使用正则表达式不一定能最好地解决这个问题。
我已经在 Perl 中给出了代码,但它可以很容易地转换为任何支持反向引用的正则表达式风格,包括grep
(其中还有-v
切换以否定匹配)。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)